微信扫码
添加专属顾问
我要投稿
告别AI Agent的“Demo惊艳,生产崩溃”!Qwen3.7-Max以35小时连续执行、超千次工具调用零中断的硬核表现,将长程智能体的稳定性变为工程现实。 核心内容: 1. Qwen3.7-Max在极限压力测试中的突破性表现 2. 实现长程稳定性的核心技术:环境多样性训练 3. 模型展现的跨框架泛化与深度推理能力
很多开发者对 AI Agent 的真实体验是:“Demo很惊艳,一上生产就崩溃。”
任务稍长就丢上下文,换个框架就性能暴跌,跑几轮就开始“自我循环”……我们需要的是一个能理解意图、规划路径、持续迭代并可靠交付的智能体基座。
今天,我们正式发布 Qwen3.7-Max 它在多项权威评测中斩获国内第一。并在 35 小时连续自主执行、1158 次工具调用零中断自主任务中证明:长程智能体的稳定性,不再是理论可能,而是工程现实。
Qwen3.7-Max 核心亮点速览
前沿编程智能体:从前端原型到复杂软件工程
持续稳定的长周期自主执行:35小时/1158次调用零中断
办公生产力与工作流自动化:MCP 集成 + 多智能体协作
跨框架泛化 + 深度推理:不挑环境,硬核基准全面领先(完整数据见文末附录)。
我们给 Qwen3.7-Max 布置了一个极限压力测试:在一块训练期从未见过的硬件平台(ZW-M890L PPU)上,自主优化 SGLang 的 Extend Attention 生产级 Kernel。
没有硬件文档、没有性能分析数据,起点只有任务描述、官方 Triton 参考实现和一个评估脚本。在约 35 小时的连续运行中,模型共产出 432 次 kernel 评估,跨越 1158 次工具调用。它完全自主地:
✅ 编写、编译、性能分析并迭代 CUDA Kernel
✅ 诊断编译报错、修复正确性 Bug
✅ 通过运行时测量定位瓶颈,多次重构底层架构
最终,在多个工作负载上实现 10.0x 几何平均加速。更关键的是,优化轨迹显示:模型在 30 小时后仍在持续发现实质性改进点。对比同期测试的其他模型(最高仅 7.3x,多数因连续 5 轮无进展而主动退出),Qwen3.7-Max 证明了两种核心能力:
长程策略连贯性 —— 不丢上下文、不退化,超千步仍保持清晰目标
In-Context 泛化力 —— 靠运行时反馈而非死记硬背,应对未知硬件也能写出高效 Kernel
能跑 35 小时不断片,靠的不是偶然。上千次调用中始终保持策略连贯的底气,来自训练阶段对“环境多样性”的彻底重构。
模型泛化能力的本质,不在于“见过多少题”,而在于“在多少种真实环境中训练过”。Qwen3.7-Max 在 Qwen3.5 的环境扩展方法基础上,进一步大幅提升了智能体训练环境的质量与多样性,将 RL 训练从合成数据推向真实分布。
这一策略带来了清晰且稳定的能力跃迁:在综合智能体评测中位列前三,性能逼近行业顶尖水平。
更重要的是,我们观察到极强的性能可预测性:在任意基准子集上的提升,都能高度一致地映射到整体表现。这证明模型学到的不是“应试技巧”,而是可迁移的通用智能体策略。
但真实痛点不止于此:很多 AI 模型专门针对某一套框架深度适配,一旦换了平台或工具,表现就大打折扣。这就需要我们在底层架构做一件事——解耦。
Qwen3.7-Max 的训练架构采用了“任务-运行框架-验证器”正交解耦设计。强化学习阶段,我们强制模型在不同框架、不同验证器组合下处理同源任务。它学到的不是“某个框架的快捷键”,而是通用的解题策略与工具调用范式。
这意味着:无论你用 Claude Code、OpenClaw、Qwen Code,还是自研的 Tool Use 框架,Qwen3.7-Max 都能即插即用,性能表现高度一致。在真实用户分布的 QwenClawBench 与长链路 CoWorkBench 评测中,无论切换何种运行环境,性能均稳定领先上一代,彻底告别“过拟合特定框架”。
底层能力的突破,最终要回归开发者的真实工作流。从写代码到自动化办公,Qwen3.7-Max 如何完成从“辅助插件”到“端到端交付者”的跨越?
面向真实生产力场景,Qwen3.7-Max 将成为您的深度协作者。 依托强大的智能体能力,它全面重塑专业工作流:从海量信息的研读整合、复杂数据的深度建模,到出版级文档与可视化生成,精准承接高复杂度、高强度的企业级任务。
编程智能体
Qwen3.7-Max 可以通过一条 prompt 生成丰富的交互式 Web 应用——包括 Three.js 3D 场景、Canvas 动画、完整页面布局和动态 SVG。
Prompt:用Three.js创建一个实时交互的3D粒子系统网页。要求:1. 通过摄像头检测双手张合控制粒子群的收缩与扩散;2. 当手势为1时,粒子组成文字(hello, world),当手势为2时组成文字 (I’am Qwen);3.粒子需实时响应手势变化;4. 用html实现。
MCP 办公与生产力助手
Qwen3.7-Max 可以通过 MCP 工具集成充当智能办公助手。它可以读取一份高校学位论文格式规范,并自动修复一篇排版混乱的论文——包括页面布局、标题样式、字体字号、页边距、目录生成和参考文献格式——全程通过 office-cli 工具自主完成。(注:详细 demo 可查看 Blog https://qwen.ai/blog?id=qwen3.7。)
多智能体与具身扩展
支持主 Agent 规划调度、子 Agent 垂直执行的多智能体编排;同时基于 Tool Use 可直接操控具身设备(如机器狗)完成真实物理环境中的理解、规划与决策,为复杂分布式工作流提供可靠基座。
Prompt:帮我看一下-1楼的Costa咖啡是否关门了
如何使用?
阿里云百炼(即将上线)
Qwen3.7-Max 即将通过阿里云百炼提供服务。您可以将其与主流智能体框架和编程助手无缝集成。平台完整兼容 OpenAI 规范(Chat Completions / Responses API)与 Anthropic API 协议,支持多地域节点灵活调用。
Qwen3.7-Max 已实现与主流智能体框架的“即插即用”。你无需修改原有 Prompt 或工具链,即可直接在 Claude Code、OpenClaw、Qwen Code 等环境中无缝调用。以下是各框架的快速接入指南:
Claude Code
Qwen API 支持 Anthropic API 协议,可直接与 Claude Code 配合使用:
npm install -g @anthropic-ai/claude-codeexport ANTHROPIC_MODEL="qwen3.7-max"export ANTHROPIC_SMALL_FAST_MODEL="qwen3.7-max"export ANTHROPIC_BASE_URL=https://dashscope.aliyuncs.com/apps/anthropicexport ANTHROPIC_AUTH_TOKEN=<your_api_key>claude
OpenClaw
通过阿里云百炼连接 OpenClaw:
curl -fsSL https://molt.bot/install.sh | bashexport DASHSCOPE_API_KEY=<your_api_key>openclaw dashboard
编辑 ~/.openclaw/openclaw.json 进行配置:
Qwen Code
Qwen Code 针对 Qwen 系列进行了深度优化:
npm install -g @qwen-code/qwen-code@latestqwen
模型表现详细图表⬇️
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-20
没更新Antigravity的先别动,更新了的我先替你们哭一会
2026-05-20
刚发布的Antigravity 2.0:从开发到管理的一跃
2026-05-20
直击 Google I/O 2026 | 轰炸式发布 Agent,狙击 Claude Code,开战!
2026-05-20
谷歌一口气发了 20 多个产品,但只想讲一件事
2026-05-20
I/O 2026:欢迎来到智能体 Gemini 时代
2026-05-20
首个Gemini桌面端曝光,系统级Agent空降PC!
2026-05-20
一文看懂 Google I/O 2026:Gemini 3.5领衔 谷歌打响智能体和全模态大战
2026-05-20
帮大家总结了一下凌晨的Google I/O 2026开发者大会。
2026-04-15
2026-03-31
2026-03-13
2026-04-07
2026-03-17
2026-03-17
2026-04-07
2026-03-21
2026-04-24
2026-02-20
2026-05-19
2026-05-09
2026-05-09
2026-05-09
2026-05-08
2026-05-07
2026-04-26
2026-04-22