2026年4月29日 周三晚上19:30,来了解“企业AI训练师:从个人提效到构建企业AI生产力”(限30人)
免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

阿里云 AI 网关支持 DeepSeek V4

发布日期:2026-04-24 18:36:31 浏览次数: 1522
作者:阿里云云原生

微信搜一搜,关注“阿里云云原生”

推荐语

DeepSeek V4重磅升级,架构与性能全面突破,阿里云AI网关率先支持其API调用。

核心内容:
1. DeepSeek V4-Pro/V4-Flash三大技术升级:流形约束残差架构、领域专家培育训练范式、混合注意力机制
2. 模型性能表现:Agent能力达开源最佳、1M上下文推理效率提升73%、世界知识接近Gemini-Pro
3. 阿里云AI网关独家支持:兼容OpenAI/Anthropic接口、提供多模型Fallback等企业级功能

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
DeepSeek%20%E5%8F%91%E5%B8%83%E4%B8%A4%E4%B8%AA%E6%A8%A1%E5%9E%8B%EF%BC%8CV4-Pro%20%E5%92%8C%20V4-Flash%E3%80%82%E5%85%B6%E6%9E%B6%E6%9E%84%E5%92%8C%E6%8A%80%E6%9C%AF%E4%BC%98%E5%8A%BF%E5%8F%AF%E4%BB%A5%E6%80%BB%E7%BB%93%E4%B8%BA%EF%BC%9A%22%7D%5D%7D%5D%2C%22attrs%22%3A%7B%7D%7D" source="https%3A%2F%2Fyuque.alibaba-inc.com%2Faliwaregrowth%2Fgk57gu%2Fidrl0finwocmff2g" data-pm-slice="0 0 []">

今天,DeepSeek 发布两个模型,V4-Pro 和 V4-Flash。其架构和技术优势可以总结为:

  • 架构升级:流形约束残差连接 mHC、Muon 优化器,提升训练质量。
  • 后训练范式升级:引入领域专家培育和 on-policy distillation(把所有专家熔融合到一个学生模型里),提升后训练效率和效果。
  • 全新的注意力机制:在 DSA 的基础上引入 CSA 和 HCA,提升 1M 上下文情况下的对话效果。

从而带来了模型效果和性价比方面的提升,包括 [1]:

  • Agent 能力大幅提高:在 Agentic Coding 评测中,V4-Pro 已达到当前开源模型最佳水平,据评测反馈使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但仍与 Opus 4.6 思考模式存在一定差距。
  • 丰富的世界知识:DeepSeek-V4-Pro 在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型 Gemini-Pro-3.1。
  • 世界顶级推理性能:在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro 超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。
  • 1M token 上下文,推理 FLOPs 只有上一代 V3.2 的 27%,KV cache 只要 10%。

DeepSeek-V4 支持 OpenAI ChatCompletions 接口与 Anthropic 接口。调用新模型 API 时,Model 参数需要改为 deepseek-v4-pro 或 deepseek-v4-flash。

阿里云 AI 网关,提供 Model API、Agent API、MCP Server 的管理能力,现已率先支持 DeepSeek-V4 API 的管理。您可以通过阿里云 AI 网关,调用 DeepSeek-V4 API 服务,包括思考、多轮对话、Tool Call、Anthropic /v1/messages 兼容调用等功能,并支持在 Claude Code 上接入 DeepSeek-V4,此外,还实现了 DeepSeek-V4 和 Qwen 等其他模型之间的 Fallback 能力。

配置方式:


打开 AI 网关控制台[2]实例页面,在顶部菜单栏选择目标实例所在地域,并单击目标实例 ID。在左侧导航栏,单击 Model API,然后单击创建 Model API。

进入创建 Model API 表单后,您可按以下说明进行配置:

  • 协议:不同协议对应该场景下的一组内置默认路由,用于快速生成常用的 OpenAI/DashScope/vLLM 等兼容接口。
  • API 名称:您可自定义 API 名称,需注意名称必须全局唯一(同一账号下不可重复),支持英文、数字、下划线“_”、“-”,且不超过 64 个字符。
  • 域名:访问该 API 的域名,支持选择多个。域名与基本路径 BasePath 的组合必须唯一。
  • Base Path:配置 API 的基本请求路径,默认为 /。可选择是否启用转发至后端服务时移除

配置完后,进行用例测试:




相关链接:

[1]《DeepSeek-V4 预览版:迈入百万上下文普惠时代

[2] AI 网关控制台

https://www.aliyun.com/product/api-gateway/ai-gateway

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询