2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

DeepSeek 给 API 网关上了一波热度

发布日期:2025-03-05 21:33:46 浏览次数: 2356
作者:阿里云云原生

微信搜一搜,关注“阿里云云原生”

推荐语

DeepSeek 技术革新,为 API 网关注入新活力。

核心内容:
1. API 网关的基本概念及其重要性
2. API 网关的发展历程、分类和核心能力
3. DeepSeek 如何与阿里云云原生 API 网关集成

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
API 网关并不是一个新的概念,但 DeepSeek 的全民化趋势给 API 网关上了一波热度。本文将围绕 API 网关的上下游概念、演进历程和分类、核心能力、DeepSeek 如何接入 API 网关等方面,和大家一起更加立体的重新认识下 API 网关。

目录:

01 引言

02 API 网关的相关概念

03 API 网关的演进历程和分类

04 API 网关的核心能力和应用场景

05 如何使用阿里云云原生 API 网关接入 DeepSeek

01

引言

Cloud Native

API 网关作为管理 API 的核心组件,在整个架构体系中扮演着至关重要的角色,它就像是一个智能的交通枢纽,负责协调和管理各种 API 请求,确保请求的安全和稳定,实现高效和丝滑的响应。大模型应用的很多刚性诉求正在通过 API 网关来满足,例如:

  • 后端接多个大模型,这即是产品体验考虑,也是稳定性的考虑,已是大模型应用的标配,无论是对话型应用,还是代码类应用。
  • 是否具备联网搜索,大模型的生成质量相差很大,前端要透出联网搜索能力的选项。
  • 内容输出安全和合规,在内容生成前进行管控。
  • 语义缓存,将 API 的响应结果临时存储在缓存服务器中,当有相同的请求再次到来时,直接从缓存中获取响应结果,降低官方 API 的调用成本。
  • 调用方配额限速,对每个调用方(如用户、应用程序、IP 地址等)在一定时间内对 API 的调用次数、流量大小或资源使用量进行限制的机制。
  • 后端保护式限流,对 API 的访问流量进行管理和控制,确保 API 能够稳定、高效地运行,包括负载均衡、限流、降级、熔断等能力。

02

API 网关的相关概念

Cloud Native


2.1 API
API(Application Programming Interface,应用程序编程接口)是一组规定和协议,它定义了不同软件应用或组件之间如何相互沟通和交互的方法。API 可以视为一个中间件,它允许开发者访问和使用某些功能或数据,而无需了解背后的详细实现。例如,阿里云 API 提供给开发者的一系列应用程序接口,使得开发者可以通过 API 来管理云上资源、数据和服务等内容。API 的分类:

图片

阿里云云原生 API 网关控制台创建 API 的入口界面
  • HTTP API:基于 HTTP 协议的接口,以路由为中心。适用于适用于对接口没有统一规范约束的场景,例如 K8s Ingress、微服务架构、AI(SSE)等场景,实现服务的对外快速暴露。
  • REST API:RESTful 风格的 HTTP接 口,以资源为导向,通过标准 HTTP 方法(如 GET、POST 等)对资源进行操作,所有接口遵循统一的 OpenAPI 规范,适用于 API First、跨团队协作、API 精细化管控等场景。
  • WebSocket 协议接口:适用于双向实时通讯,如 AI、IoT、即时通讯等。相比 HTTP API,WebSocket 提供了实时数据传输能力,内置长连接相关默认配置。
  • AI API:针对 AI 网关优化的 API 类型,提供更友好的 AI 网关配置和调试能力,并预置 AI 代理、AI 观测、消费者鉴权、内容安全防护等插件能力。

2.2 API 网关

API 网关(即 API Gateway,简写:APIG)是一种提供 API 托管服务的中间件。它处于客户端和后端服务之间,是客户端访问后端服务的唯一入口。所有来自客户端的请求都首先经过 API 网关,然后由 API 网关将请求路由到后端的服务。它就像一个门卫,负责对请求进行身份验证、权限检查、流量控制等操作,确保 API 请求的安全和稳定。


2.3 其他相关概念
图片
  • 域名:浏览器里的地址,客户端请求的开始,即 www.xxx.com。
  • DNS:域名系统,将域名地址解析位对应的 IP 地址,用于计算机在网络上的互相识别和通信。
  • IP 地址:为互联网上的每个设备(如计算机、手机、路由器等)提供了一个逻辑地址,确保数据包可以准确地从源设备发送到目标设备。
  • 路由:指在网络中,数据包从源地址到目的地址传输过程中所经过的路径选择过程。创建路由过程中,可以定义请求的路径、方法、参数等规则,将请求分发到对应的后端服务。
  • 来源和服务:请求到了 API 网关后,通过动态获取后端服务列表才能继续访问服务,需要支持容器服务、Nacos、固定地址、DNS 域名和 Serverless 计算等多种形式,来添加服务。
  • 环境:定义了 API 生命周期管理过程中的不同状态,API 可以被发布到不同的自定义环境中,如开发环境、测试环境、生产环境等,以便在不同阶段对 API 进行测试和管理。
  • API 分组:是同一种业务 API 的集合,可视为一种服务,如征信查询服务。API 开发者以 API 分组为单位,管理分组内的所有 API,方便对同类业务的 API 进行统一管理和维护。
  • 消费者:是客户端访问 API 的凭证。启用消费者,需要在对应接口/路由中开启消费者认证,并创建消费者与接口/路由的授权关系。开启消费者认证后,只有被消费者授权的接口/路由,才可使用对应凭证访问。

03

API 网关的演进历程和分类

Cloud Native

API 网关并非独立的,而是伴随着软件架构的演进尔演进。软件架构经历了单体架构、垂直架构、SOA 架构、微服务架构、云原生架构,随着大模型的普及,开始往 AI 原生架构演进,这个过程中,API 网关的形态也在随之迭代,在不同软件架构阶段中呈现出不同的形态。

3.1 流量网关
图片

负责管理和优化数据流量,以提升业务的可伸缩性和高可用性。Nginx 作为流量网关的代表性软件,以其高效的性能和灵活的配置广受欢迎。流量网关的核心目的是解决多业务节点的流量负载均衡问题,通过智能调度将客户请求分配到不同的服务器上,从而均匀分摊负载,避免单点故障,确保服务的稳定性和连续性。


3.2 企业服务总线(ESB)网关
图片

专为企业设计的关键集成解决方案,旨在标准化和简化不同系统和服务之间的通信与消息传送。遵循服务导向型架构(SOA)原则,ESB 通过集中管理消息路由、转换和安全,实现服务的快速部署和高效运作。


3.3 微服务网关
图片

负责集中管理微服务的路由规则,增强系统安全性,提供性能监控,并简化访问流程,从而提高整个系统的可靠性。微服务网关可以实现负载均衡、限流、熔断、身份验证等功能,通过统一入口管理和优化各微服务间的交互。此举不仅简化了客户端与微服务的通信复杂性,还为系统安全提供了额外的保护,Spring Cloud Gateway 是一个广泛应用的微服务网关,它基于 Spring 生态系统,易于与 Spring Boot 项目集成,因其灵活、高效和可扩展性受到了开发者的青睐。


3.4 云原生网关
图片

伴随 K8s 的广泛应用而诞生的一种创新网关,K8s 集群内外网络天然隔离的特性要求通过网关来将外部请求转发给集群内部服务,K8s 采用 Ingress/Gateway API 来统一网关的配置方式,同时 K8s 提供了弹性扩缩容来帮助用户解决应用容量调度问题,基于此用户对网关产生了新的诉求:期望网关既能有流量网关的特性来处理海量请求,又具备微服务网关的特性来做服务发现与服务治理,同时要求网关也具备弹性扩缩容能力解决容量调度问题,例如 Envoy 和 Higress 是典型的开源云原生网关。


3.5 AI 网关

我们认为,AI 网关并不是独立于云原生网关的新形态,本质上也可以称之为云原生网关,区别在于针对 AI 场景的新需求专门做了扩展,例如提供多模型灵活切换&兜底重试、大模型内容安全和合规、语义化缓存、多 API Key 均衡、Token 配额管理和限流、大模型流量灰度、调用成本审计等能力。业内,Higress 和 Kong 在云原生网关的基础上,演进出了专门面向 AI 场景的能力,此外,还有 Traefix、Cloudflare 均设计了 AI 网关的产品和服务。关于 AI 网关的核心能力,可以参考我们之前的文章《AI 网关需要具备的 10 大基本能力》。

04

API 网关的核心能力

Cloud Native

由于围绕 API 提供的网关能力繁多,涉及的角色众多,我们将所有能力基于使用方进行分类,包括研发、供应和消费三类场景,分别对应 API 接口的研发团队、API 平台的研发和运维团队、API 平台的外部调用方。

图片


4.1 API 研发场景

API First 是先定义好 API 规范,再 code。不同于不定义 API,直接 coding,API First 强调的是在构建应用程序之前优先设计和开发 API 接口,将 API 视为系统的核心架构组件,通过定义良好的接口规范实现模块化。例如公共云的云产品都提供了 API 的调用方式,微信小程序、钉钉开放平台也面向开发者提供了 API 接口,类似乐高积木的模块化系统,通过标准接口实现服务间的灵活组合,提升系统的可扩展性和维护性,从而提升生态效率。在研发场景下,API 网关可以覆盖 API 的设计、开发、测试、发布、售卖、运维监测、安全管控、下线等围绕 API 的各个生命周期。


4.2 API 供应场景
API 供应场景指 API 提供方(如企业、平台或服务)通过标准化接口对外暴露数据或功能的过程。其核心是创建、管理和维护 API,确保其可用性、安全性和高效性。核心能力包括:
  • API 安全:保护 API 免受各种安全威胁,确保只有经过授权的用户、应用程序能够访问 API,并保障数据在传输和存储过程中的保密性、完整性和可用性。例如身份验证、授权管理、数据加解密、防攻击机制。
  • 灰度:是一种在生产环境中逐步引入新 API 版本或功能的策略,允许将一部分用户或请求流量导向新版本的 API,同时将其余部分仍保持在旧版本上,从而在不影响整体系统稳定性和用户体验的前提下,对新 API 进行测试和验证。
  • 缓存:指将 API 的响应结果临时存储在缓存服务器中,当有相同的请求再次到来时,直接从缓存中获取响应结果,而无需再次访问后端服务器,从而提高 API 的响应速度和系统的性能。

4.3 API 消费场景
API 消费场景指调用方(如应用、开发者)通过集成外部 API 快速实现功能或获取数据的过程。其核心是使用平台方提供的能力或数据,实现业务需求。
  • 调用审计:对 API 的调用活动进行全面记录、监控和分析的过程。它会详细记录每一次 API 调用的相关信息,包括调用时间、调用方身份、调用的 API 接口、请求参数、响应结果、响应时间等。
  • 调用方配额限速:指 API 网关根据预先设定的规则,对每个调用方(如用户、应用程序、IP 地址等)在一定时间内对 API 的调用次数、流量大小或资源使用量进行限制的机制。
  • 后端保护式限流:对 API 的访问流量进行管理和控制,确保 API 能够稳定、高效地运行,避免因流量过大或异常流量导致的系统崩溃和性能下降,包括负载均衡、限流、降级、熔断等能力。
05

如何使用阿里云云原生 

API 网关接入 DeepSeek

Cloud Native


5.1 前提条件
  • 专有网络 VPC 已创建公网 NAT 网关,并绑定公网弹性 IP,具体操作见创建和管理专有网络[1]、使用公网 NAT 网关 SNAT 功能访问互联网[2]。
  • 基于上述 VPC,创建云原生 API 网关实例,具体操作请参见创建网关实例
    [3]。
下列演示中,提供 3 个场景供参考:
  • 已集成模型接入 AI 网关
  • 通用模型接入 AI 网关
  • AI 网关实现多模型代理


5.2 场景 1,已集成模型接入 AI 网关
阿里云云原生 API 网关中已经集成部分大模型供应商,该类模型可通过选择供应商及配置 API-KEY 直接接入。包含:阿里云百炼、DeepSeek、OpenAI、Azure、Claude、月之暗面、百川智能、零一万物、智谱AI、混元、阶跃星辰、星火、豆包(火山引擎)、MiniMax、Gemini。

配置 AI 服务

网关通过服务发送请求,创建 AI 服务参考以下方式进行:

1. 登录云原生 API 网关控制台。

2. 在左侧导航栏,选择实例,并在顶部菜单栏选择地域。

3. 在实例页面,单击目标网关实例名称。

4. 在左侧导航栏,选择服务,并单击服务页签。

5. 单击创建服务,在创建服务面板,参考如下信息配置 AI 服务:

  • 服务来源:AI 服务。
  • 大模型供应商:填写对应的模型供应商。
  • 服务地址:使用默认配置。
  • API-KEY:填写模型供应商获取的请求凭证 API-KEY。
  • 阿里云百炼配置示例:
    • 大模型供应商:阿里云百炼。
    • 服务地址:https://dashscope.aliyuncs.com/compatible-model/v1
    • API-KEY:填写阿里云百炼获得的 API-KEY。

图片

配置 AI API

1. 返回云原生 API 网关控制台首页,在左侧导航栏,选择 API。

2. 选择 AI API 页签,单击创建 AI API。
图片
3. 在创建 AI API 控制面板中,配置 AI API 基本信息,其中:
  • 域名:建议配置域名(使用默认环境域名下存在限流)
  • 所属实例:选择创建的实例
  • AI 请求观测:开启
  • 服务模型:单模型服务
  • 服务列表:点击添加,添加下列服务。并选择上一步中配置的阿里云百炼 DeepSeek 服务,模型名称配置为透传

图片

调试 AI API

创建完成的 AI API 界面中,点击调试。
图片
指定模型为 deepseek-r1,和阿里云百炼的 DeepSeek 进行对话。

图片


5.3 场景 2,通用模型方式接入 AI 网关
该场景中通过自定义服务地址,支持以下几种情况:
  • 对于云原生 API 网关中未集成大模型供应商,且该模型支持 OpenAI 协议。
  • 对于通过在阿里云 PAI 或者 FC 等方式部署的 DeepSeek 服务。

本场景中,可直接参考 PAI 部署模型接入 AI 网关[4]方式中的进行接入。


5.4 场景 3,AI 网关多模型代理

配置 AI API

当前云原生 API 网关支持同时基于已集成模型+通用模型的方式接入,提供多模型代理服务,并支持调用异常情况下 Fallback;在该类场景下,用户使用统一调用方式,同时调用不同的三方模型服务。
1. 基于场景 1、场景 2 分别完成了三个网关 AI 服务配置,阿里云百炼、火山引擎、PAI,火山引擎的服务配置可参考下面进行。

图片

2. 在 AI API 创建时(或进入编辑态),按照以下方式配置大模型服务:

  • 服务模型:多模型服务(按模型名称)
  • 服务列表:点击添加,添加下列多个服务。
    • 选择上一步中配置的 PAI DeepSeek 服务,模型名称匹配规则配置为 DeepSeek-*
    • 选择上一步中配置的火山引擎 DeepSeek 服务,模型名称匹配规则配置为 ep-*
  • Fallback:开启
  • Fallback 列表:点击添加,添加下列服务。
    • 选择上一步中配置的阿里云百炼 DeepSeek 服务,模型名称配置为 deepseek-r1

图片

如图所示的配置会按照下列规则执行:

  • 模型为 DeepSeek-* 时调用 PAI DeepSeek
  • 模型为 ep-* 时调用火山引擎 DeepSeek;
  • 在出错或限流场景下调用阿里云 DeepSeek。(如配置多个 Fallback,则按顺序调用)

调试 AI API

创建完成的 AI API 界面中,点击调试
图片
填写模型名称为 ep-20250219155230-28l6f、DeepSeek-R1-Distill-Qwen-1.5B 时,会按照规则响应火山引擎、PAI。
图片
当填写一个错误的名称,此时没有对应的 DeepSeek 模型,因此会触发 Fallback,调用到阿里云 DeepSeek-R1:
图片

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅