我要投稿

Qwen3.7-Max 重新定义 AI Agent 基座

发布日期：2026-05-20 11:56:47 浏览次数： 1596

作者：通义实验室

微信搜一搜，关注“通义实验室”

很多开发者对 AI Agent 的真实体验是：“Demo很惊艳，一上生产就崩溃。”

任务稍长就丢上下文，换个框架就性能暴跌，跑几轮就开始“自我循环”……我们需要的是一个能理解意图、规划路径、持续迭代并可靠交付的智能体基座。

今天，我们正式发布 Qwen3.7-Max 它在多项权威评测中斩获国内第一。并在 35 小时连续自主执行、1158 次工具调用零中断自主任务中证明：长程智能体的稳定性，不再是理论可能，而是工程现实。

Qwen3.7-Max 核心亮点速览

前沿编程智能体：从前端原型到复杂软件工程
持续稳定的长周期自主执行：35小时/1158次调用零中断
办公生产力与工作流自动化：MCP 集成 + 多智能体协作
跨框架泛化 + 深度推理：不挑环境，硬核基准全面领先（完整数据见文末附录）。

我们给 Qwen3.7-Max 布置了一个极限压力测试：在一块训练期从未见过的硬件平台（ZW-M890L PPU）上，自主优化 SGLang 的 Extend Attention 生产级 Kernel。

没有硬件文档、没有性能分析数据，起点只有任务描述、官方 Triton 参考实现和一个评估脚本。在约 35 小时的连续运行中，模型共产出 432 次 kernel 评估，跨越 1158 次工具调用。它完全自主地：

✅ 编写、编译、性能分析并迭代 CUDA Kernel
✅ 诊断编译报错、修复正确性 Bug
✅ 通过运行时测量定位瓶颈，多次重构底层架构

最终，在多个工作负载上实现 10.0x 几何平均加速。更关键的是，优化轨迹显示：模型在 30 小时后仍在持续发现实质性改进点。对比同期测试的其他模型（最高仅 7.3x，多数因连续 5 轮无进展而主动退出），Qwen3.7-Max 证明了两种核心能力：

长程策略连贯性 —— 不丢上下文、不退化，超千步仍保持清晰目标
In-Context 泛化力 —— 靠运行时反馈而非死记硬背，应对未知硬件也能写出高效 Kernel

“

能跑 35 小时不断片，靠的不是偶然。上千次调用中始终保持策略连贯的底气，来自训练阶段对“环境多样性”的彻底重构。

”

模型泛化能力的本质，不在于“见过多少题”，而在于“在多少种真实环境中训练过”。Qwen3.7-Max 在 Qwen3.5 的环境扩展方法基础上，进一步大幅提升了智能体训练环境的质量与多样性，将 RL 训练从合成数据推向真实分布。

这一策略带来了清晰且稳定的能力跃迁：在综合智能体评测中位列前三，性能逼近行业顶尖水平。

更重要的是，我们观察到极强的性能可预测性：在任意基准子集上的提升，都能高度一致地映射到整体表现。这证明模型学到的不是“应试技巧”，而是可迁移的通用智能体策略。

“

但真实痛点不止于此：很多 AI 模型专门针对某一套框架深度适配，一旦换了平台或工具，表现就大打折扣。这就需要我们在底层架构做一件事——解耦。

”

Qwen3.7-Max 的训练架构采用了“任务-运行框架-验证器”正交解耦设计。强化学习阶段，我们强制模型在不同框架、不同验证器组合下处理同源任务。它学到的不是“某个框架的快捷键”，而是通用的解题策略与工具调用范式。

这意味着：无论你用 Claude Code、OpenClaw、Qwen Code，还是自研的 Tool Use 框架，Qwen3.7-Max 都能即插即用，性能表现高度一致。在真实用户分布的 QwenClawBench 与长链路 CoWorkBench 评测中，无论切换何种运行环境，性能均稳定领先上一代，彻底告别“过拟合特定框架”。

“

底层能力的突破，最终要回归开发者的真实工作流。从写代码到自动化办公，Qwen3.7-Max 如何完成从“辅助插件”到“端到端交付者”的跨越？

”

面向真实生产力场景，Qwen3.7-Max 将成为您的深度协作者。依托强大的智能体能力，它全面重塑专业工作流：从海量信息的研读整合、复杂数据的深度建模，到出版级文档与可视化生成，精准承接高复杂度、高强度的企业级任务。

编程智能体

Qwen3.7-Max 可以通过一条 prompt 生成丰富的交互式 Web 应用——包括 Three.js 3D 场景、Canvas 动画、完整页面布局和动态 SVG。

Prompt：用Three.js创建一个实时交互的3D粒子系统网页。要求：1. 通过摄像头检测双手张合控制粒子群的收缩与扩散；2. 当手势为1时，粒子组成文字（hello, world），当手势为2时组成文字（I’am Qwen）；3.粒子需实时响应手势变化；4. 用html实现。

MCP 办公与生产力助手

Qwen3.7-Max 可以通过 MCP 工具集成充当智能办公助手。它可以读取一份高校学位论文格式规范，并自动修复一篇排版混乱的论文——包括页面布局、标题样式、字体字号、页边距、目录生成和参考文献格式——全程通过 office-cli 工具自主完成。（注：详细 demo 可查看 Blog https://qwen.ai/blog?id=qwen3.7。）

多智能体与具身扩展

支持主 Agent 规划调度、子 Agent 垂直执行的多智能体编排；同时基于 Tool Use 可直接操控具身设备（如机器狗）完成真实物理环境中的理解、规划与决策，为复杂分布式工作流提供可靠基座。

Prompt：帮我看一下-1楼的Costa咖啡是否关门了

如何使用？

为了方便大家体验 Qwen3.7-Max，我们在 API 协议兼容与框架集成上做了全面对齐。

阿里云百炼（即将上线）

Qwen3.7-Max 即将通过阿里云百炼提供服务。您可以将其与主流智能体框架和编程助手无缝集成。平台完整兼容 OpenAI 规范（Chat Completions / Responses API）与 Anthropic API 协议，支持多地域节点灵活调用。

"""Environment variables:  DASHSCOPE_API_KEY: Your API Key from https://bailian.console.aliyun.com/  DASHSCOPE_BASE_URL: (optional) Base URL for compatible-mode API.    - Beijing: https://dashscope.aliyuncs.com/compatible-mode/v1    - Singapore: https://dashscope-intl.aliyuncs.com/compatible-mode/v1    - US (Virginia): https://dashscope-us.aliyuncs.com/compatible-mode/v1"""from openai import OpenAIimport os
api_key = os.environ.get("DASHSCOPE_API_KEY")ifnot api_key:    raise ValueError(        "DASHSCOPE_API_KEY is required. "        "Set it via: export DASHSCOPE_API_KEY='your-api-key'"    )
client = OpenAI(    api_key=api_key,    base_url=os.environ.get(        "DASHSCOPE_BASE_URL",        "https://dashscope.aliyuncs.com/compatible-mode/v1",    ),)
messages = [{"role": "user", "content": "用Python写一个合并两个有序链表的函数。"}]
completion = client.chat.completions.create(    model="qwen3.7-max",    messages=messages,    extra_body={        "enable_thinking": True,        # "preserve_thinking": True,    },    stream=True)
reasoning_content = ""answer_content = ""is_answering = Falseprint("\n" + "=" * 20 + "Reasoning" + "=" * 20 + "\n")
for chunk in completion:    ifnot chunk.choices:        print("\nUsage:")        print(chunk.usage)        continue
    delta = chunk.choices[0].delta
    if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None:        ifnot is_answering:            print(delta.reasoning_content, end="", flush=True)        reasoning_content += delta.reasoning_content
    if hasattr(delta, "content") and delta.content:        ifnot is_answering:            print("\n" + "=" * 20 + "Answer" + "=" * 20 + "\n")            is_answering = True        print(delta.content, end="", flush=True)        answer_content += delta.content

Qwen3.7-Max 已实现与主流智能体框架的“即插即用”。你无需修改原有 Prompt 或工具链，即可直接在 Claude Code、OpenClaw、Qwen Code 等环境中无缝调用。以下是各框架的快速接入指南：

Claude Code

Qwen API 支持 Anthropic API 协议，可直接与 Claude Code 配合使用：

npm install -g @anthropic-ai/claude-code
export ANTHROPIC_MODEL="qwen3.7-max"export ANTHROPIC_SMALL_FAST_MODEL="qwen3.7-max"export ANTHROPIC_BASE_URL=https://dashscope.aliyuncs.com/apps/anthropicexport ANTHROPIC_AUTH_TOKEN=<your_api_key>
claude

OpenClaw

通过阿里云百炼连接 OpenClaw：

curl -fsSL https://molt.bot/install.sh | bashexport DASHSCOPE_API_KEY=<your_api_key>openclaw dashboard

编辑 ~/.openclaw/openclaw.json 进行配置：

{  "models": {    "mode": "merge",    "providers": {      "bailian": {        "baseUrl": "https://dashscope.aliyuncs.com/compatible-mode/v1",        "apiKey": "DASHSCOPE_API_KEY",        "api": "openai-completions",        "models": [          {            "id": "qwen3.7-max",            "name": "qwen3.7-max",            "reasoning": true,            "input": ["text"],            "contextWindow": 1000000,            "maxTokens": 65536          }        ]      }    }  },  "agents": {    "defaults": {      "model": {        "primary": "bailian/qwen3.7-max"      }    }  }}

Qwen Code

Qwen Code 针对 Qwen 系列进行了深度优化：

npm install -g @qwen-code/qwen-code@latestqwen

模型表现详细图表⬇️

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-05-20

没更新Antigravity的先别动，更新了的我先替你们哭一会

2026-05-20

刚发布的Antigravity 2.0：从开发到管理的一跃

2026-05-20

直击 Google I/O 2026 | 轰炸式发布 Agent，狙击 Claude Code，开战！

2026-05-20

谷歌一口气发了 20 多个产品，但只想讲一件事

2026-05-20

I/O 2026：欢迎来到智能体 Gemini 时代

2026-05-20

首个Gemini桌面端曝光，系统级Agent空降PC！

2026-05-20

一文看懂 Google I/O 2026：Gemini 3.5领衔谷歌打响智能体和全模态大战

2026-05-20

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

2026年国内如何注册 Claude 账号教程

2026-03-13

OpenAI Codex CLI 完整使用指南

2026-04-07

独家| DeepSeek-V4终于要来了：梁文锋憋半年大招，多模态+长期记忆全面破局

2026-03-17

香港终于能直接用 Gemini 了，内地用户能用上吗？

2026-03-17

Claude Code 和 Codex 接入 Figma MCP 保姆级教程

2026-04-07

编程选GPT-5.4，还是GPT-5.3-Codex？

2026-03-21

GPT5.5来了，最大特点解析

2026-04-24

全球首个 AI 进化网络 EvoMap，给 Agent 装上 DNA

2026-02-20

大家都在问

Harness Engineering：AI 能在真正"出事会炸"的后端系统里写代码吗？

2026-05-19

谁来给企业端即将大规模入职的Agent盖办公室？

2026-05-09

鹅厂员工觉得好的code模型应该具备什么能力？

2026-05-09

Markdown要被抛弃了？Claude Code工程师自曝：我已彻底放弃使用Markdown！团队倾向使用HTML！网友：其他编辑工具会被淘汰吗？

2026-05-09

AI吞噬软件的叙事要分化了？

2026-05-08

为什么同一个模型，在 Claude Code/Codex CLI 里感觉像换了个脑子？

2026-05-07

「双线实测」Qwen 3.6-Plus，Agentic Coding 已经这么能「扛活儿」了？

2026-04-26

本体化语义层，会是 AI 数据平台的新地基吗？

2026-04-22

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw