2026年4月2日 19:30分,来腾讯会议(限30人)了解如何用Openclaw构建企业AI生产力
免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

中国最强编程模型来了! 阿里Qwen3.6-Plus性能直逼Claude,国产大模型杀入决赛圈

发布日期:2026-04-02 15:24:13 浏览次数: 1559
作者:量子位

微信搜一搜,关注“量子位”

推荐语

阿里Qwen3.6-Plus强势登场,编程能力直逼全球顶尖Claude系列,国产大模型迎来重大突破!

核心内容:
1. Qwen3.6-Plus在编程和智能体能力上的突破性表现
2. 模型在真实评测中接近甚至超越Claude系列的性能
3. 已全面上线阿里云百炼等平台,开放API服务

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

什么这code那code,先别code了,因为——

中国最强编程模型来了!

就在刚刚,阿里突袭发布Qwen3.6-Plus新一代基座大模型,在编程智能体能力上,直接捅破了国产大模型的天花板,强到Next Level~

那…到底有多Next呢? ?

1M上下文直接拉满,不仅能独立拆解任务、规划执行路径、全程自测迭代达到目标,还能根据简单提示词搓出Vibe Coding

这不嘛,前几天模型的preview版本提前上了OpenRouter,小编也拿到开白资格抢先实测了一番!

我只给了AI一句话,几秒钟就得到了一个可移缩放的3D的雪山场景多模态网页,连雪花都是动态飘落的~

模型表现归模型表现,关键还是要拉到真实评测中见真章啊!!

值得一提的是,在涵盖智能体编程、真实世界任务的权威评测中,Qwen3.6-Plus目前已经成为了最接近全球最强Claude系列的国产模型:

(Claude:不er,哥们儿???)

专业搞代码的大佬们拿到Qwen3.6-Plus更是爽感拉满,这不嘛,提前体验过的网友们速速给出反馈了——

下面这位大哥直言,速度和生成体验感比Claude更夯,Opus 4.6你还得加把劲儿啊!

更有硬核网友直接开了压力测试,在5个复合仓库里轮番轰炸,得出的结论嘛:甭说别的,这模型是真靠谱~

目前,Qwen3.6-Plus已第一时间上线阿里云百炼,且API服务已全面开放;此外,在悟空、千问APP等阿里AI应用和平台也已同步上线。

这下好了,大家可以——直接上手搓搓搓了!!

Vibe Coding、多模态理解能力忒夯

不知道大家们还记不记得,上个月Qwen3.5刚发布的时候,全网都在感叹模型强大的编程能力。

但老话说得好,一代更比一代强,事实上相较于上一代模型,这次发布的Qwen3.6-Plus在编程Coding能力、智能体Agent能力和工具调用能力上直接上演了一场大型的《自己卷自己》的戏码。(doge)

咋个卷法呢?

在性能上,Qwen3.6-Plus表现出了比上一代模型更敏锐的理解感知能力和更强大的多模态推理能力。

在SWE-bench系列真实编程任务测试、考察终端编程的Terminal-Bench2、长程编程任务NL2Repo,以及Claw-Eval、QwenClawBench等真实世界Agent能力评测中——

Qwen3.6-Plus几乎直逼Claude Opus 4.5,甚至部分性能表现比Claude更优,还超越了2倍乃至3倍参数量的其他主流模型。

看来,千问妥妥掌握了「以小胜大」的秘方啊??

不仅如此,基于百万token的上下文窗口。

模型还集中对OpenClaw、Qwen Code、Claude Code、Kilo Code、Cline、OpenCode等系列Agent框架进行了优化支持。

是的,这模型卷的已经不只是模型本体,连整套Agent工作流的适配度都梭哈了…

只能说——《夯,极夯》。

咱们直接老规矩,围绕模型擅长的Vibe Coding、多模态理解、问题重构等几个能力维度上实打实测一波!

Vibe Coding能力实测

常言道,用编程模型必玩Vibe Coding,所以,咱就先来考一考Qwen3.6-Plus在网页开发上的能力~

大家都知道,对AI或者Agent来说,网页开发其实不是啥难事儿,真正的挑战在于——

只用一句简单提示词,就能做出兼具视觉设计、交互逻辑与页面跳转的完整页面,所以咱这次直接把难度抬高。

用一句大白话指令,让AI一键生成一个可交互的「AI资讯日历网站」

帮我生成一个有科技感的AI日历网站。首页为月历视图,每一天标注对应的AI大事件,用户点击日期后可进入详情页查看完整内容,包括事件标题、一句话简介、时间和来源链接。

大概2分钟的时间,AI就给我搓出来了个完成度相当高的AI资讯日历网页。

前端生成效果来看,整体视觉简洁而且科技味儿还蛮浓,不仅清晰呈现了日历结构,还自动对不同资讯做了色彩区分,阅读体验十分友好!!!

具体交互能力上,还支持前后月份翻阅查询,每日日期格子内均标注可点击的资讯入口,点一下就能查看摘要内容。

此外,不知道大家发现没,页面右侧还附带一个可跳转链接,一键就能跳到原资讯网站,查阅信息源贼方便:

接下来,我们换种玩法,不生成网页了,改玩点有意思的。

挑战用一句话让AI帮忙制作一个可交互的色彩度比较鲜明的3D的雪山场景,看看这AI在前端视觉上的表现力咋样。

制作一个3D的雪山场景,雪山中间有一个日式的寺庙,整体风格参考塞尔达旷野之息。

先看视觉效果,u1s1确实有点塞尔达那种清新明快画风的意思,色彩饱和度和光影质感肉眼看都还是蛮舒服的。

不仅如此,我还可以灵活拖动视角,360度旋转场景、用滚轮自由缩放远近这些都ok,甚至,连雪花粒子都是动态飘落的???

我们继续挑战,再来实测一些更好玩的场景,这回看看Qwen3.6-Plus的「游戏网站」搭建能力咋样~

帮我做一个虚拟宠物养成网页,页面主体是宠物的房间,用户可以随时看到它的状态,宠物有饥饿、心情、体力和成长值,会随时间变化,用户可以在房间里进行喂食、玩耍、洗澡、睡觉等互动,加入简单动画、表情变化、随机事件和任务系统,完成可获得金币购买道具,整体风格可爱~

So cute!!瞬间梦回小时候玩的《皮卡堂》小游戏~(萌翻了.jpg)

从实际效果看,在这个页面里我不仅可以查看宠物的动态,宠物还可以跟着我的鼠标位置进行移动

不仅如此,页面右侧还设有状态值、互动功能、任务商店四大板块,我还可以根据宠物状态进行喂食、玩耍等互动操作。

你还真别说,Qwen3.6-Plus在审美和交互设计这块儿提升不少,确实真·有两下子…

咱们最后再来试一个大家几乎都玩过的消消乐小游戏,这次我直接把提示词写到简单不能再简单:

生成一个美食卡通主题的消消乐小游戏网站。

哪怕提示词如此大白话,哪怕如此简单,这输出效果也确实没得说。

是的,我只用了一句提示词,Qwen3.6-Plus把核心玩法、连锁机制、视觉UI、辅助能力这些全cover了…

多模态理解能力实测

除了强大的Vibe Coding能力外,Qwen3.6-Plus在多模态理解这块儿也属实有两把刷子。

具体来说,就是从视觉感知,到多模态推理,再到智能体执行都能hold得住!

这次我喂给了模型一段AI资讯类的视频内容,整个视频时长说实话还蛮长的,很考验模型的内容解析能力

我要让它做的,不单单只是解析视频核心内容,而是要让它帮我进行逐秒脚本分析,并且根据内容二创成一份适合小红书笔记发的爆款文案,以下是我喂给Qwen3.6-Plus的原视频:

请你帮我解析一下这条视频内容,做逐秒脚本拆解,并根据视频内容二创成一篇适合发小红书的爆款笔记文案:

可以看到,Qwen3.6-Plus不仅给我进行了逐秒的视频脚本拆解,而且每一个视角戳里还帮我贴心地将脚本从视觉、内容、目的三个维度进行了推理判断。

不仅如此,在下方还按照要求输出了对应的小红书爆款文案,并将文案概括成开头钩子、核心内容、关键发现、引起共鸣几个维度,666啊~

最后的最后,我们再来上点难度,让Qwen3.6-Plus尝试根据图片内容复刻一个在线网页

这次,我喂给了它一个旅游规划的页面图片,让它根据页面里的功能,直接复刻并搭建出一个完整的在线网页——

哪怕几乎没有任何文字的提示词指令,Qwen3.6-Plus依旧通过多模态能力准确出了图片的内容,并且嘛——比我图片里手画的页面布局效果更好、视觉呈现更牛、内容更充实??

更复杂的编程场景照样在行

看到这儿估计有朋友该说了,上面这些场景多少有点太简单了吧。

你还真别说,更硬核的编程场景这不就来了嘛!

事实上,除了能用简单提示词实现Vibe Coding、解析并执行多模态内容外,Qwen3.6-Plus还能基于命令行工具生成页面、进行代码问题分析与重构,甚至自主开发工具

在命令行页面生成能力上,Qwen3.6-Plus支持通过CC等工具直接调用API。

我们只需输入 「根据开源仓库生成landing page」这类简洁指令,就能快速产出完整网页,实现高效自动化的前端开发!!

话不多说!先给咱们「电子老婆」来个项目官网主页~

这里说的电子老婆,正是GitHub上的开源项目AIRI—— 仿照超火虚拟主播Neuro-sama打造,能实时陪聊、陪打游戏,妥妥全天候在线的电子伴侣(doge)。

通过VS Code中的Qwen Code插件,我让Qwen3.6-Plus直接读取开源项目介绍,自主理解需求、规划页面结构,并一次性输出完整可用的代码:

(提供项目)根据这个开源项目生成landing page,输出HTML+tailwind CSS。

从Thinking过程可以清晰地观察到Qwen3.6-Plus一步步查看需求、创建文件,整个过程能够实时监测:

Done!耗时约3分钟,Qwen3.6-Plus就生成好了项目官网页面,代码自动保存在landing-page.html文件中:

咱打开html文件来看下效果~

首先,看上去还蛮符合项目的宣传逻辑,把临时体验页面、项目开源地址、社区地址全都关联上了。

不仅如此,导航栏还能够跳转到对应内容,把项目介绍里包含的能力、可兼容的模型厂商、部署步骤都给概括全了,不戳不戳~

接下来,我们来测试模型的「问题分析与代码重构」能力。

这次我又在Qwen Code命令行工具里,喂给了Qwen3.6-Plus一坨问题不小的老旧代码,让它捉捉虫:

(提供项目)我刚接手这个项目,该怎么优化呢?

Qwen3.6-Plus看懂了原有逻辑,自动整理了一份优化清单,但是在动手之前还是询问了一句「需要开始实施吗」。

比起其他大刀阔斧直接上手的模型来说,这份分寸感把握得还是相当不赖的~

下一步,当然就是让它帮我修改x山代码了!!我反手就是一个——

这里一定要说个好玩的,Qwen你的碎碎念也有太活人感了,先给产品经理画饼,然后去push服务器,接着又在老板面前装!模!作!样!

(还有啥是你做不出来的??)

说归说闹归闹,任务还得按部就班搞下去,修完Bug、再做优化,主打一个有条不紊~

优化完成!人家具体都改了点啥呢——请看下方总结。最后嘛,还来了点小建议,be like:

安装依赖、写测试脚本都可以直接交给它来做,我全程省心省力只负责点头。(美哉美哉~)

(Qwen3.6-Plus:俺的编程本事,可是不孬!!!)

AI编程的门槛,这回是真被打下来了

说实话,从今年年初开始,我们真的接触了太多太多的AI Agent和各种Claw字辈儿的龙虾。

此外还有一个大家感知很深的事是,当下厂商们也越来越押注模型的编程能力,各种Vibe Coding产品也层出不穷。

我自己也在社交软件上刷到过很多感兴趣的项目,点开之前觉得蛮有意思,可一看对方用到的提示词和辅助工具,我很快就意识到了一个问题。

那就是没点提示词本事,没点基础编程能力,想做出和人家同款效果的Vibe Coding产品,真的蛮难的…(哭死…)

只能说,大家还是苦Vibe Coding《上手门槛》久矣。

图片由AI生成

这次实测Qwen3.6-Plus下来,除了对于模型在复杂代码治理、跨域长程规划等真实世界的专业编程任务的中呈现的过硬能力外,我更大的感受在于——

它确确实实把普通人的「编程门槛」大幅拉低了。

基于自然语言驱动的Vibe Coding不再是概念,只要一句大白话,我们就能把脑子里的想法直接变成可运行的现实。

在过去很长一段时间,行业默认用参数规模来换性能提升,模型越大,效果越好,也越贵。

而这一次,Qwen3.6-Plus通过一个体量更轻的模型,交出了可以对标甚至超过2到3倍参数模型的结果,这对我们用户来说当然是好事情。

当然,更进一步从行业角度看,也不难看出Qwen3.6-Plus也正是阿里ATH(Alibaba Token Hub)思路在编程模型上一次很有代表性的落地。

创造高效Token、输送低成本Token、应用普惠化Token,在ATH成立后仅一个月的时间,就速速口号照进现实了。

最后值得一提的是,Qwen3.6-Plus是千问3.6系列推出的第一个模型。

后面千问3.6系列还会开源更多不同尺寸的版本给大家,另外性能更强的旗舰款Qwen3.6-Max也会在近期发布。

大家可以小小期待一下子~

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询