2026年5月21日 周四晚上19:30,报名腾讯会议了解“从个人提效到构建企业AI生产力”(限30人)
免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

Qwen3.7来了,全球排名第13,国内第一

发布日期:2026-05-20 07:45:07 浏览次数: 1521
作者:算泥

微信搜一搜,关注“算泥”

推荐语

Qwen3.7预览版发布,全球排名第13位,成为国内大模型新标杆,展现了在数理推理和代码生成等关键领域的突破性进步。

核心内容:
1. Qwen3.7系列预览版在Arena竞技场的亮眼排名与突破
2. 模型在数学、编程等细分赛道展现出的强劲技术深度
3. 阿里大模型“小步快跑”的加速迭代策略与行业影响

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
算泥社区是集 “AI 大模型开发服务 + 算法 + 算力” 于一体的开源生态社区,欢迎关注!


5月18日,Arena(大模型竞技场)官方账号突然公布了Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview的最新成绩。

Qwen官方账号迅速跟进:“我们已经迫不及待想发布Qwen3.7系列了!”

上一个版本还来不及讨论完,下一个版本已经端上了桌。

官微预告,“来了来了,TA要来了”。说的应该就是20日阿里云峰会将发布Qwen 3.7。

从Arena公布的成绩来看,两款预览版模型各有亮点。

Qwen3.7-Max-Preview在文本领域整体排名第13,是全球前十五名中唯一的中国模型,这一成绩直接将阿里巴巴的实验室排名推升至第6位。

排在它前面的,分别是Claude Opus 4.6和4.7系列、Gemini-3.1/3 Pro系列、GPT-5.4/5.4-High等西方头部模型。

而Qwen3.7-Plus-Preview在视觉领域拿下第16名,让阿里实验室在视觉赛道的总排名攻入前五,同样是该榜单上国产模型的最高名次。

值得关注的是,在细分赛道中,Qwen3.7-Max-Preview展现出了强劲的技术深度:数学赛道排名第7,专家提示赛道排名第9,软件/IT赛道排名第9,Coding赛道排名第10,均进入全球前十。

模型不仅是综合能力的提升,更是在数理推理、专业知识和代码生成等关键赛道上实现了突破性进步。

模型发布节奏加速

4月底阿里才刚刚发布了Qwen3.6-Max-Preview,到了5月19日Qwen3.7预览版就已端上桌了。

Qwen3.6-Max还处于预览版阶段,Qwen3.7-Max预览版就紧随其后,这种“两代超大杯并行迭代”的现象,在业内极为罕见。

回顾整个Qwen的迭代历史,可以清晰地看到这种加速趋势。早期(2023–2024年),Qwen的发布节奏相对稳健,大版本更新间隔4至6个月,与行业主流节奏相当。

转折点发生在Qwen3系列:2025年发布的Qwen3包含Dense模型和MoE模型,参数规模从0.6B到235B,引入了Thinking模式和Non-Thinking模式的双模式设计。

其中Thinking模式支持复杂推理、长链路决策和Agent任务,Non-Thinking模式则偏向低延迟快速响应。这一设计思路极大地拓展了模型的应用边界。

而进入2026年以后,Qwen3及后续版本的迭代节奏明显提速,大版本间隔缩短至2至3个月一次,并且几乎每个月都有新动作。

从Qwen3.5到Qwen3.6再到Qwen3.7,版本号更新非常迅速。而且普遍节奏是预览版先上线,社区先测试,开发者先用,然后正式版再跟进。

这一策略既能让团队快速获取市场反馈,也能在竞争中占据话语权,是典型的“小步快跑”迭代策略。

回顾2025年,阿里在云栖大会上,阿里云智能CTO周靖人在大会上宣布,通义已成为全球第一开源模型,开源300余模型,全球下载超6亿次,衍生模型17万个。

2026年,Qwen前负责人林俊昂离开时发布的那条推特:“Qwen的兄弟们,按原来安排继续干,没问题的。”他离开时,Qwen处于3.5时代,与DeepSeek一样是国产开源界的标杆模型。

不管是延续以往的作风,还是在新负责人的带领下,后续的Qwen3.5、3.7版本,确实依然在一步一步更快,也更好。

国内大模型竞争白热化

从2025年开始,国内大模型竞争就已经从“技术竞赛”转向“生态竞争”,阿里、字节、腾讯、百度四大厂各自站队,形成了新的竞争格局。

据统计,2025年四巨头的整体资本开支增长了45%,而结合调研数据和市场预期,2026年预计还将增长30%。

这意味着大模型赛道的竞争本质已经从“模型能力”转变为“生态控制力”之争。

DeepSeek依然是国内大模型市场的一个重要变量。

26年,DeepSeek-V4正式上线,梁文峰启动外部融资,开始招聘Harness产品经理,正式开启DeepSeek版的Claude Code进化之路。

腾讯混元重组后,近期刚发布的混元Hy3 Preview模型,展现了强有力的竞争态势。

OpenRouter的数据显示,4月28日至5月11日连续三周登顶OpenRouter周榜总榜。

而小米MiMo v2.5 Pro,在专家竞技场排名第7。

除了前文提到的几家头部大厂,智谱、MiniMax、阶跃星辰、Kimi等玩家也在密集出牌,各自寻找差异化路径,试图在竞争激烈的市场中占据一席之地。

智谱无疑是近期最引人注目的明星之一。2026年1月,智谱以“全球大模型第一股”的身份登陆港交所,此后股价一路飙升,市值一度突破5000亿港元。

在模型层面,智谱今年先后发布GLM-5和GLM-5.1旗舰模型,其中GLM-5.1在编程Agent场景中代表了国产大模型的SOTA水平。智谱一反过去价格战的逻辑,率先打破“免费”叙事,多次上调API价格,将编码场景定价直逼Anthropic的Claude Sonnet 4.6。

这一定价策略背后是技术底气的支撑:2026年一季度,智谱API调用定价虽提升83%,调用量却增长了400%,供不应求的局面让市场对这种“技术溢价”投下信任票。

MiniMax同样势头强劲。3月,MiniMax发布旗舰模型M2.7,首次展示了“模型自我进化”路径。

该模型通过Agent Harness框架深度参与自身训练优化,在部分研发场景中可承担30%至50%的工作量,内部评测集上实现约30%的效果提升。

MiniMax还推出了新一代音乐生成模型Music 2.6,首包延迟大幅降至20秒以内。在资本市场,MiniMax与智谱共同构成了港股大模型概念的核心力量。

Kimi背后的月之暗面则在融资和技术两端同时发力。4月20日,月之暗面发布并开源Kimi K2.6模型,采用1T参数MoE架构,支持连续编码13小时、Agent可持续自主运行5天,重登开源模型全球第一。

在商业化层面,Kimi的年度经常性收入在2026年4月突破2亿美元,并完成新一轮约20亿美元融资,投后估值突破200亿美元。

除了以上,其他玩家也并未停下脚步。阶跃星辰、商汤、蚂蚁等等都有自己强劲的模型陆续发布。

纵观全局,2026年中国大模型赛道的竞争焦点已全面转向商业化效率和生态控制力。

接下来的比拼,将更多取决于谁能率先跑通商业闭环,在“开源生态、定价策略和客户黏性”的三角博弈中找到最优解。

参考资料:

https://x.com/Alibaba_Qwen/status/2056403591464984753


END

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询