2026年4月2日 19:30分,来腾讯会议(限30人)了解如何用Openclaw构建企业AI生产力
免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

10 分钟做完小红书图文生成器,这次 Qwen3.6 有点猛。

发布日期:2026-04-02 15:12:41 浏览次数: 1542
作者:AI产品银海

微信搜一搜,关注“AI产品银海”

推荐语

阿里Qwen3.6-Plus模型震撼升级,10分钟打造小红书图文生成器,AI生产力再创新高!

核心内容:
1. Qwen3.6-Plus模型在Agentic Coding场景的全面能力提升
2. 从文本生成到图像创作的一站式解决方案
3. 十分钟快速搭建实用工具的完整开发流程

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


就在刚刚,阿里发布了新模型 Qwen 3.6-Plus 。


这一次,它重点强化的是 Agentic Coding 场景下的能力,并且从任务理解、拆解,到多轮推理,再到工具调用,整个链路都在往前走。


同时也支持多模态输入,信息处理的维度更完整了。


我第一时间就去跑了一轮实测。


结论先说:确实有提升,而且是那种能明显感知到的提升,特别是在用一轮对话的方式直接生成整个前端界面的效果上,视觉的质感提升太多了。


用一段话生成的 AI 语音输入法关联硬件的展示页面。

用一段话生成的电商美妆独立站展示页面。

另外围绕本次的 Coding 实战,我这次没有去跑一些标准 benchmark,而是直接拿它做了一个小工具:一个小红书图文生成器。

从一个模糊的想法开始,到最后能跑起来的产品形态,整个过程基本都是我和 Qwen 3.6-Plus 一起对话完成的,大概花费我十分钟左右,我是认真的。


我简单讲一下这个东西是怎么一步步做出来的,你也能复刻。


一开始我的目标很直接:输入一句话或者一个标题,生成一整篇小红书笔记,同时配上对应风格的图片,也就是「文案 + 图片」一体化输出。


接下来我做的事情,其实就是不断把这个想法讲清楚,然后让模型帮我往下补全。


整个能力拆下来,其实就是三块。


第一块,是 Qwen 3.6 本身的模型能力。


我是通过阿里云百炼的 API 来集成到 Cline 里面进行调用的。


阿里云百炼地址:https://bailian.console.aliyun.com/


也可以直接用阿里的一些 AI IDE,比如 Qoder、悟空,这类工具基本都可以直接上手,门槛不高。


第二块,是文本生成能力。


也就是从一句话扩展成完整的小红书笔记。


这一部分我用的是百炼里的文本模型(Qwen3.5 Flash 系列),响应快,成本也比较友好,很适合这种高频生成场景。


第三块,是图像生成能力。我用的是百炼里的 Qwen-Image-2.0-Pro 模型,这个模型在做内容平台风格的图片时,整体质感是在线的,至少在小红书这种场景里是够用的。


当这三块能力准备好之后,其实就是一件事:把它们串起来。


我当时的做法挺简单的,就是把这些 API 文档直接复制整理成 Markdown,放进整个项目里,然后把我的阿里云百炼API Key 直接给 Qwen 3.6-Plus ,然后让它基于这些 API 能力帮我把整个工具搭出来。


接下来就是产品界面和具体功能层的设计。


我让它做了一个左右结构的界面,大概整体第一轮的描述类似这样:


1.左边是输入区,用户输入标题或者一句话需求,点击“生成文案”,实用文本生成模型会先生成完整的小红书笔记。同时左侧还可以选择图片风格、参考图,以及图片数量这些参数。

2.右边是图片生成区,会根据左侧的文本内容,实时去生成对应的图片,需要考虑多图并发生成的问题,这样整体速度会更快。

3.设计风格上尽量贴近小红书的感觉,比如卡片式布局、偏轻量的视觉,再加一点毛玻璃效果,看起来更像一个可以用的产品。

4.接入我的所有API服务,完成真实项目调试和运行。


当基本功能跑通之后,后面的工作其实就很像在调产品。


一边优化文案生成的稳定性,一边调整文本生成文案的提示词、图像生成的提示词,让图文之间的匹配更自然。


上面这个提示词这块,也是我增加的图像参考里面,Qwen 3.6-Plus 自动帮我写的提示词优化,整个过程中,我几乎没有去手写复杂代码,大部分都是在对话。


我描述需求,它生成代码,我说哪里不对,它改,我加新功能,它继续补。


这个来回几轮之后,一个能用的小工具就出来了,后面我自己就可以不断地批量出图出稿子。


其实我自己是有点被惊到的,如果我再补充分发渠道,比如一键推送到小红书平台,这个工具就会更丝滑了。


以前很多时候,我还是把模型当工具,用完就结束。但这次不太一样,我是一路跟它对话、拉扯、修正,最后把一个东西做出来的。


中间有几次我真的会下意识说一句:卧槽,这一轮就能跑起来了啊。


那种感觉挺奇妙的,有点像你随口说了个想法,旁边有个人默默帮你把它实现了,而且还能跟你一起反复打磨。


我之前一直在反复想一件事:以后做产品,是不是不再是「我写 PRD,工程实现」,后面估计就是「我和模型一起把产品长出来」。


我们很多做产品、做运营、甚至做内容的人,其实都要重新理解能力的边界。


所以如果你最近也在折腾 AI 应用,我会很建议你别只看 demo,自己真的动手做一个小东西出来。


现在Qwen3.6 Plus 版本都让我有些惊艳了,默认支持100万上下文窗口、显著提升的智能体编程能力、更出色的多模态感知与推理能力。


更期待它的Qwen 3.6 Max 版本了。


后面会进化到哪一步,我现在也说不准。


但至少此刻,我是有点兴奋的,而且真的做出自己想做的东西了。


关键是还很快!!

© THE END


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询