微信扫码
添加专属顾问
我要投稿
Qwen3.7预览版发布,全球排名第13位,成为国内大模型新标杆,展现了在数理推理和代码生成等关键领域的突破性进步。核心内容:1. Qwen3.7系列预览版在Arena竞技场的亮眼排名与突破2. 模型在数学、编程等细分赛道展现出的强劲技术深度3. 阿里大模型“小步快跑”的加速迭代策略与行业影响
5月18日,Arena(大模型竞技场)官方账号突然公布了Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview的最新成绩。
Qwen官方账号迅速跟进:“我们已经迫不及待想发布Qwen3.7系列了!”
上一个版本还来不及讨论完,下一个版本已经端上了桌。
官微预告,“来了来了,TA要来了”。说的应该就是20日阿里云峰会将发布Qwen 3.7。
从Arena公布的成绩来看,两款预览版模型各有亮点。
Qwen3.7-Max-Preview在文本领域整体排名第13,是全球前十五名中唯一的中国模型,这一成绩直接将阿里巴巴的实验室排名推升至第6位。
排在它前面的,分别是Claude Opus 4.6和4.7系列、Gemini-3.1/3 Pro系列、GPT-5.4/5.4-High等西方头部模型。
而Qwen3.7-Plus-Preview在视觉领域拿下第16名,让阿里实验室在视觉赛道的总排名攻入前五,同样是该榜单上国产模型的最高名次。
值得关注的是,在细分赛道中,Qwen3.7-Max-Preview展现出了强劲的技术深度:数学赛道排名第7,专家提示赛道排名第9,软件/IT赛道排名第9,Coding赛道排名第10,均进入全球前十。
模型不仅是综合能力的提升,更是在数理推理、专业知识和代码生成等关键赛道上实现了突破性进步。
4月底阿里才刚刚发布了Qwen3.6-Max-Preview,到了5月19日Qwen3.7预览版就已端上桌了。
Qwen3.6-Max还处于预览版阶段,Qwen3.7-Max预览版就紧随其后,这种“两代超大杯并行迭代”的现象,在业内极为罕见。
回顾整个Qwen的迭代历史,可以清晰地看到这种加速趋势。早期(2023–2024年),Qwen的发布节奏相对稳健,大版本更新间隔4至6个月,与行业主流节奏相当。
转折点发生在Qwen3系列:2025年发布的Qwen3包含Dense模型和MoE模型,参数规模从0.6B到235B,引入了Thinking模式和Non-Thinking模式的双模式设计。
其中Thinking模式支持复杂推理、长链路决策和Agent任务,Non-Thinking模式则偏向低延迟快速响应。这一设计思路极大地拓展了模型的应用边界。
而进入2026年以后,Qwen3及后续版本的迭代节奏明显提速,大版本间隔缩短至2至3个月一次,并且几乎每个月都有新动作。
从Qwen3.5到Qwen3.6再到Qwen3.7,版本号更新非常迅速。而且普遍节奏是预览版先上线,社区先测试,开发者先用,然后正式版再跟进。
这一策略既能让团队快速获取市场反馈,也能在竞争中占据话语权,是典型的“小步快跑”迭代策略。
回顾2025年,阿里在云栖大会上,阿里云智能CTO周靖人在大会上宣布,通义已成为全球第一开源模型,开源300余模型,全球下载超6亿次,衍生模型17万个。
2026年,Qwen前负责人林俊昂离开时发布的那条推特:“Qwen的兄弟们,按原来安排继续干,没问题的。”他离开时,Qwen处于3.5时代,与DeepSeek一样是国产开源界的标杆模型。
不管是延续以往的作风,还是在新负责人的带领下,后续的Qwen3.5、3.7版本,确实依然在一步一步更快,也更好。
从2025年开始,国内大模型竞争就已经从“技术竞赛”转向“生态竞争”,阿里、字节、腾讯、百度四大厂各自站队,形成了新的竞争格局。
据统计,2025年四巨头的整体资本开支增长了45%,而结合调研数据和市场预期,2026年预计还将增长30%。
这意味着大模型赛道的竞争本质已经从“模型能力”转变为“生态控制力”之争。
DeepSeek依然是国内大模型市场的一个重要变量。
26年,DeepSeek-V4正式上线,梁文峰启动外部融资,开始招聘Harness产品经理,正式开启DeepSeek版的Claude Code进化之路。
腾讯混元重组后,近期刚发布的混元Hy3 Preview模型,展现了强有力的竞争态势。
OpenRouter的数据显示,4月28日至5月11日连续三周登顶OpenRouter周榜总榜。
而小米MiMo v2.5 Pro,在专家竞技场排名第7。
除了前文提到的几家头部大厂,智谱、MiniMax、阶跃星辰、Kimi等玩家也在密集出牌,各自寻找差异化路径,试图在竞争激烈的市场中占据一席之地。
智谱无疑是近期最引人注目的明星之一。2026年1月,智谱以“全球大模型第一股”的身份登陆港交所,此后股价一路飙升,市值一度突破5000亿港元。
在模型层面,智谱今年先后发布GLM-5和GLM-5.1旗舰模型,其中GLM-5.1在编程Agent场景中代表了国产大模型的SOTA水平。智谱一反过去价格战的逻辑,率先打破“免费”叙事,多次上调API价格,将编码场景定价直逼Anthropic的Claude Sonnet 4.6。
这一定价策略背后是技术底气的支撑:2026年一季度,智谱API调用定价虽提升83%,调用量却增长了400%,供不应求的局面让市场对这种“技术溢价”投下信任票。
MiniMax同样势头强劲。3月,MiniMax发布旗舰模型M2.7,首次展示了“模型自我进化”路径。
该模型通过Agent Harness框架深度参与自身训练优化,在部分研发场景中可承担30%至50%的工作量,内部评测集上实现约30%的效果提升。
MiniMax还推出了新一代音乐生成模型Music 2.6,首包延迟大幅降至20秒以内。在资本市场,MiniMax与智谱共同构成了港股大模型概念的核心力量。
Kimi背后的月之暗面则在融资和技术两端同时发力。4月20日,月之暗面发布并开源Kimi K2.6模型,采用1T参数MoE架构,支持连续编码13小时、Agent可持续自主运行5天,重登开源模型全球第一。
在商业化层面,Kimi的年度经常性收入在2026年4月突破2亿美元,并完成新一轮约20亿美元融资,投后估值突破200亿美元。
除了以上,其他玩家也并未停下脚步。阶跃星辰、商汤、蚂蚁等等都有自己强劲的模型陆续发布。
纵观全局,2026年中国大模型赛道的竞争焦点已全面转向商业化效率和生态控制力。
接下来的比拼,将更多取决于谁能率先跑通商业闭环,在“开源生态、定价策略和客户黏性”的三角博弈中找到最优解。
参考资料:
https://x.com/Alibaba_Qwen/status/2056403591464984753
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-20
Hermes Agent + Ollama本地安装指南
2026-05-17
开源、零依赖、R@5 精度 95%:agentmemory 凭什么比 mem0 更值得用
2026-05-16
Hermes Agent 深度解析:为什么它能“越用越懂你”?
2026-05-15
再见 Hermes、小龙虾! 面向 DeepSeek V4 的终端原生编程智能体来了
2026-05-15
GenericAgent 实测:Token 少用 89.6%,还能打赢 Claude Code?上下文密度才是关键
2026-05-14
腾讯开源Agent Memory,让Token消耗降低61%
2026-05-14
agents-hive 开源了:一个面向生产的Harness Agent 工程
2026-05-12
Hermes Agent 完整安装指南
2026-03-30
2026-04-03
2026-03-23
2026-04-09
2026-03-31
2026-03-03
2026-04-01
2026-02-22
2026-03-04
2026-03-09
2026-05-16
2026-04-22
2026-04-21
2026-04-15
2026-04-09
2026-04-01
2026-03-17
2026-03-13