我要投稿

10 分钟做完小红书图文生成器，这次 Qwen3.6 有点猛。

发布日期：2026-04-02 15:12:41 浏览次数： 2410

作者：AI产品银海

微信搜一搜，关注“AI产品银海”

就在刚刚，阿里发布了新模型 Qwen 3.6-Plus 。

这一次，它重点强化的是 Agentic Coding 场景下的能力，并且从任务理解、拆解，到多轮推理，再到工具调用，整个链路都在往前走。

同时也支持多模态输入，信息处理的维度更完整了。

我第一时间就去跑了一轮实测。

结论先说：确实有提升，而且是那种能明显感知到的提升，特别是在用一轮对话的方式直接生成整个前端界面的效果上，视觉的质感提升太多了。

用一段话生成的 AI 语音输入法关联硬件的展示页面。

用一段话生成的电商美妆独立站展示页面。

另外围绕本次的 Coding 实战，我这次没有去跑一些标准 benchmark，而是直接拿它做了一个小工具：一个小红书图文生成器。

从一个模糊的想法开始，到最后能跑起来的产品形态，整个过程基本都是我和 Qwen 3.6-Plus 一起对话完成的，大概花费我十分钟左右，我是认真的。

我简单讲一下这个东西是怎么一步步做出来的，你也能复刻。

一开始我的目标很直接：输入一句话或者一个标题，生成一整篇小红书笔记，同时配上对应风格的图片，也就是「文案 + 图片」一体化输出。

接下来我做的事情，其实就是不断把这个想法讲清楚，然后让模型帮我往下补全。

整个能力拆下来，其实就是三块。

第一块，是 Qwen 3.6 本身的模型能力。

我是通过阿里云百炼的 API 来集成到 Cline 里面进行调用的。

阿里云百炼地址：https://bailian.console.aliyun.com/

也可以直接用阿里的一些 AI IDE，比如 Qoder、悟空，这类工具基本都可以直接上手，门槛不高。

第二块，是文本生成能力。

也就是从一句话扩展成完整的小红书笔记。

这一部分我用的是百炼里的文本模型（Qwen3.5 Flash 系列），响应快，成本也比较友好，很适合这种高频生成场景。

第三块，是图像生成能力。我用的是百炼里的 Qwen-Image-2.0-Pro 模型，这个模型在做内容平台风格的图片时，整体质感是在线的，至少在小红书这种场景里是够用的。

当这三块能力准备好之后，其实就是一件事：把它们串起来。

我当时的做法挺简单的，就是把这些 API 文档直接复制整理成 Markdown，放进整个项目里，然后把我的阿里云百炼API Key 直接给 Qwen 3.6-Plus ，然后让它基于这些 API 能力帮我把整个工具搭出来。

接下来就是产品界面和具体功能层的设计。

我让它做了一个左右结构的界面，大概整体第一轮的描述类似这样：

1.左边是输入区，用户输入标题或者一句话需求，点击“生成文案”，实用文本生成模型会先生成完整的小红书笔记。同时左侧还可以选择图片风格、参考图，以及图片数量这些参数。

2.右边是图片生成区，会根据左侧的文本内容，实时去生成对应的图片，需要考虑多图并发生成的问题，这样整体速度会更快。

3.设计风格上尽量贴近小红书的感觉，比如卡片式布局、偏轻量的视觉，再加一点毛玻璃效果，看起来更像一个可以用的产品。

4.接入我的所有API服务，完成真实项目调试和运行。

当基本功能跑通之后，后面的工作其实就很像在调产品。

一边优化文案生成的稳定性，一边调整文本生成文案的提示词、图像生成的提示词，让图文之间的匹配更自然。

上面这个提示词这块，也是我增加的图像参考里面，Qwen 3.6-Plus 自动帮我写的提示词优化，整个过程中，我几乎没有去手写复杂代码，大部分都是在对话。

我描述需求，它生成代码，我说哪里不对，它改，我加新功能，它继续补。

这个来回几轮之后，一个能用的小工具就出来了，后面我自己就可以不断地批量出图出稿子。

其实我自己是有点被惊到的，如果我再补充分发渠道，比如一键推送到小红书平台，这个工具就会更丝滑了。

以前很多时候，我还是把模型当工具，用完就结束。但这次不太一样，我是一路跟它对话、拉扯、修正，最后把一个东西做出来的。

中间有几次我真的会下意识说一句：卧槽，这一轮就能跑起来了啊。

那种感觉挺奇妙的，有点像你随口说了个想法，旁边有个人默默帮你把它实现了，而且还能跟你一起反复打磨。

我之前一直在反复想一件事：以后做产品，是不是不再是「我写 PRD，工程实现」，后面估计就是「我和模型一起把产品长出来」。

我们很多做产品、做运营、甚至做内容的人，其实都要重新理解能力的边界。

所以如果你最近也在折腾 AI 应用，我会很建议你别只看 demo，自己真的动手做一个小东西出来。

现在Qwen3.6 Plus 版本都让我有些惊艳了，默认支持100万上下文窗口、显著提升的智能体编程能力、更出色的多模态感知与推理能力。

更期待它的Qwen 3.6 Max 版本了。

后面会进化到哪一步，我现在也说不准。

但至少此刻，我是有点兴奋的，而且真的做出自己想做的东西了。

关键是还很快！！

© THE END

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-05-18

从0开发大模型的17种Agent架构演进详细拆解

2026-05-18

Anthropic 的 Dreaming 功能，解决的是"谁托管你的 Agent 循环"的问题

2026-05-18

腾讯上线 AI 设计平台 Ardot，一句话生成 UI 设计稿，AI 版 Figma

2026-05-16

Kiro：亚马逊新出的 AI 编程工具，免费白嫖一个月 Claude Opus 4.7

2026-05-16

突发！OpenAI高层巨震，ChatGPT与CodeX或合并，超级AI来了！

2026-05-16

AI Native 创业手册 | 蚂上WEEKLY VOL.172

2026-05-16

腾讯造了个“贾维斯”：替我签到改配置，还会打盹上厕所，一手实测来了

2026-05-16

从零构建AI Agent：没有魔法，只有循环

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

2026年国内如何注册 Claude 账号教程

2026-03-13

OpenAI Codex CLI 完整使用指南

2026-04-07

独家| DeepSeek-V4终于要来了：梁文锋憋半年大招，多模态+长期记忆全面破局

2026-03-17

香港终于能直接用 Gemini 了，内地用户能用上吗？

2026-03-17

Claude Code 和 Codex 接入 Figma MCP 保姆级教程

2026-04-07

编程选GPT-5.4，还是GPT-5.3-Codex？

2026-03-21

GPT5.5来了，最大特点解析

2026-04-24

全球首个 AI 进化网络 EvoMap，给 Agent 装上 DNA

2026-02-20

大家都在问

谁来给企业端即将大规模入职的Agent盖办公室？

2026-05-09

鹅厂员工觉得好的code模型应该具备什么能力？

2026-05-09

Markdown要被抛弃了？Claude Code工程师自曝：我已彻底放弃使用Markdown！团队倾向使用HTML！网友：其他编辑工具会被淘汰吗？

2026-05-09

AI吞噬软件的叙事要分化了？

2026-05-08

为什么同一个模型，在 Claude Code/Codex CLI 里感觉像换了个脑子？

2026-05-07

「双线实测」Qwen 3.6-Plus，Agentic Coding 已经这么能「扛活儿」了？

2026-04-26

本体化语义层，会是 AI 数据平台的新地基吗？

2026-04-22

设计行业的“棺材板”，要被Claude Design盖上了？

2026-04-18

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部