2026年5月21日 周四晚上19:30,报名腾讯会议了解“从个人提效到构建企业AI生产力”(限30人)
免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

Qwen3.7-Max 重新定义 AI Agent 基座

发布日期:2026-05-20 11:56:47 浏览次数: 1596
作者:通义实验室

微信搜一搜,关注“通义实验室”

推荐语

告别AI Agent的“Demo惊艳,生产崩溃”!Qwen3.7-Max以35小时连续执行、超千次工具调用零中断的硬核表现,将长程智能体的稳定性变为工程现实。

核心内容:
1. Qwen3.7-Max在极限压力测试中的突破性表现
2. 实现长程稳定性的核心技术:环境多样性训练
3. 模型展现的跨框架泛化与深度推理能力

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

很多开发者对 AI Agent 的真实体验是:“Demo很惊艳,一上生产就崩溃。”

任务稍长就丢上下文,换个框架就性能暴跌,跑几轮就开始“自我循环”……我们需要的是一个能理解意图、规划路径、持续迭代并可靠交付的智能体基座。

今天,我们正式发布 Qwen3.7-Max 它在多项权威评测中斩获国内第一。并在 35 小时连续自主执行、1158 次工具调用零中断自主任务中证明:长程智能体的稳定性,不再是理论可能,而是工程现实。

Qwen3.7-Max 核心亮点速览


  • 前沿编程智能体:从前端原型到复杂软件工程

  • 持续稳定的长周期自主执行:35小时/1158次调用零中断

  • 办公生产力与工作流自动化:MCP 集成 + 多智能体协作

  • 跨框架泛化 + 深度推理:不挑环境,硬核基准全面领先(完整数据见文末附录)。


我们给 Qwen3.7-Max 布置了一个极限压力测试:在一块训练期从未见过的硬件平台(ZW-M890L PPU)上,自主优化 SGLang 的 Extend Attention 生产级 Kernel。

没有硬件文档、没有性能分析数据,起点只有任务描述、官方 Triton 参考实现和一个评估脚本。在约 35 小时的连续运行中,模型共产出 432 次 kernel 评估,跨越 1158 次工具调用。它完全自主地: 

✅ 编写、编译、性能分析并迭代 CUDA Kernel
✅ 诊断编译报错、修复正确性 Bug
✅ 通过运行时测量定位瓶颈,多次重构底层架构 

最终,在多个工作负载上实现 10.0x 几何平均加速。更关键的是,优化轨迹显示:模型在 30 小时后仍在持续发现实质性改进点。对比同期测试的其他模型(最高仅 7.3x,多数因连续 5 轮无进展而主动退出),Qwen3.7-Max 证明了两种核心能力:

  • 长程策略连贯性 —— 不丢上下文、不退化,超千步仍保持清晰目标

  • In-Context 泛化力 —— 靠运行时反馈而非死记硬背,应对未知硬件也能写出高效 Kernel

能跑 35 小时不断片,靠的不是偶然。上千次调用中始终保持策略连贯的底气,来自训练阶段对“环境多样性”的彻底重构。

模型泛化能力的本质,不在于“见过多少题”,而在于“在多少种真实环境中训练过”。Qwen3.7-Max 在 Qwen3.5 的环境扩展方法基础上,进一步大幅提升了智能体训练环境的质量与多样性,将 RL 训练从合成数据推向真实分布。

这一策略带来了清晰且稳定的能力跃迁:在综合智能体评测中位列前三,性能逼近行业顶尖水平。

更重要的是,我们观察到极强的性能可预测性:在任意基准子集上的提升,都能高度一致地映射到整体表现。这证明模型学到的不是“应试技巧”,而是可迁移的通用智能体策略

但真实痛点不止于此:很多 AI 模型专门针对某一套框架深度适配,一旦换了平台或工具,表现就大打折扣。这就需要我们在底层架构做一件事——解耦。

Qwen3.7-Max 的训练架构采用了“任务-运行框架-验证器”正交解耦设计。强化学习阶段,我们强制模型在不同框架、不同验证器组合下处理同源任务。它学到的不是“某个框架的快捷键”,而是通用的解题策略与工具调用范式。

这意味着:无论你用 Claude Code、OpenClaw、Qwen Code,还是自研的 Tool Use 框架,Qwen3.7-Max 都能即插即用,性能表现高度一致。在真实用户分布的 QwenClawBench 与长链路 CoWorkBench 评测中,无论切换何种运行环境,性能均稳定领先上一代,彻底告别“过拟合特定框架”。

底层能力的突破,最终要回归开发者的真实工作流。从写代码到自动化办公,Qwen3.7-Max 如何完成从“辅助插件”到“端到端交付者”的跨越?

面向真实生产力场景,Qwen3.7-Max 将成为您的深度协作者。 依托强大的智能体能力,它全面重塑专业工作流:从海量信息的研读整合、复杂数据的深度建模,到出版级文档与可视化生成,精准承接高复杂度、高强度的企业级任务。


编程智能体

Qwen3.7-Max 可以通过一条 prompt 生成丰富的交互式 Web 应用——包括 Three.js 3D 场景、Canvas 动画、完整页面布局和动态 SVG。

Prompt:用Three.js创建一个实时交互的3D粒子系统网页。要求:1. 通过摄像头检测双手张合控制粒子群的收缩与扩散;2. 当手势为1时,粒子组成文字(hello, world),当手势为2时组成文字 (I’am Qwen);3.粒子需实时响应手势变化;4. 用html实现。



MCP 办公与生产力助手

Qwen3.7-Max 可以通过 MCP 工具集成充当智能办公助手。它可以读取一份高校学位论文格式规范,并自动修复一篇排版混乱的论文——包括页面布局、标题样式、字体字号、页边距、目录生成和参考文献格式——全程通过 office-cli 工具自主完成。(注:详细 demo 可查看 Blog https://qwen.ai/blog?id=qwen3.7。)


多智能体与具身扩展

支持主 Agent 规划调度、子 Agent 垂直执行的多智能体编排;同时基于 Tool Use 可直接操控具身设备(如机器狗)完成真实物理环境中的理解、规划与决策,为复杂分布式工作流提供可靠基座。

Prompt:帮我看一下-1楼的Costa咖啡是否关门了


如何使用?

为了方便大家体验 Qwen3.7-Max,我们在 API 协议兼容与框架集成上做了全面对齐。


阿里云百炼(即将上线)

Qwen3.7-Max 即将通过阿里云百炼提供服务。您可以将其与主流智能体框架和编程助手无缝集成。平台完整兼容 OpenAI 规范(Chat Completions / Responses API)与 Anthropic API 协议,支持多地域节点灵活调用。

"""Environment variables:  DASHSCOPE_API_KEY: Your API Key from https://bailian.console.aliyun.com/  DASHSCOPE_BASE_URL: (optional) Base URL for compatible-mode API.    - Beijing: https://dashscope.aliyuncs.com/compatible-mode/v1    - Singapore: https://dashscope-intl.aliyuncs.com/compatible-mode/v1    - US (Virginia): https://dashscope-us.aliyuncs.com/compatible-mode/v1"""from openai import OpenAIimport os
api_key = os.environ.get("DASHSCOPE_API_KEY")ifnot api_key:    raise ValueError(        "DASHSCOPE_API_KEY is required. "        "Set it via: export DASHSCOPE_API_KEY='your-api-key'"    )
client = OpenAI(    api_key=api_key,    base_url=os.environ.get(        "DASHSCOPE_BASE_URL",        "https://dashscope.aliyuncs.com/compatible-mode/v1",    ),)
messages = [{"role""user""content""用Python写一个合并两个有序链表的函数。"}]
completion = client.chat.completions.create(    model="qwen3.7-max",    messages=messages,    extra_body={        "enable_thinking"True,        # "preserve_thinking": True,    },    stream=True)
reasoning_content = ""answer_content = ""is_answering = Falseprint("\n" + "=" * 20 + "Reasoning" + "=" * 20 + "\n")
for chunk in completion:    ifnot chunk.choices:        print("\nUsage:")        print(chunk.usage)        continue
    delta = chunk.choices[0].delta
    if hasattr(delta, "reasoning_content"and delta.reasoning_content is not None:        ifnot is_answering:            print(delta.reasoning_content, end="", flush=True)        reasoning_content += delta.reasoning_content
    if hasattr(delta, "content"and delta.content:        ifnot is_answering:            print("\n" + "=" * 20 + "Answer" + "=" * 20 + "\n")            is_answering = True        print(delta.content, end="", flush=True)        answer_content += delta.content

Qwen3.7-Max 已实现与主流智能体框架的“即插即用”。你无需修改原有 Prompt 或工具链,即可直接在 Claude Code、OpenClaw、Qwen Code 等环境中无缝调用。以下是各框架的快速接入指南:


Claude Code

Qwen API 支持 Anthropic API 协议,可直接与 Claude Code 配合使用:

npm install -g @anthropic-ai/claude-code
export ANTHROPIC_MODEL="qwen3.7-max"export ANTHROPIC_SMALL_FAST_MODEL="qwen3.7-max"export ANTHROPIC_BASE_URL=https://dashscope.aliyuncs.com/apps/anthropicexport ANTHROPIC_AUTH_TOKEN=<your_api_key>
claude


OpenClaw

通过阿里云百炼连接 OpenClaw

curl -fsSL https://molt.bot/install.sh | bashexport DASHSCOPE_API_KEY=<your_api_key>openclaw dashboard

编辑 ~/.openclaw/openclaw.json 进行配置:

{  "models": {    "mode": "merge",    "providers": {      "bailian": {        "baseUrl": "https://dashscope.aliyuncs.com/compatible-mode/v1",        "apiKey": "DASHSCOPE_API_KEY",        "api": "openai-completions",        "models": [          {            "id": "qwen3.7-max",            "name": "qwen3.7-max",            "reasoning": true,            "input": ["text"],            "contextWindow": 1000000,            "maxTokens": 65536          }        ]      }    }  },  "agents": {    "defaults": {      "model": {        "primary": "bailian/qwen3.7-max"      }    }  }}


Qwen Code

Qwen Code 针对 Qwen 系列进行了深度优化:

npm install -g @qwen-code/qwen-code@latestqwen

模型表现详细图表⬇️

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询