2026年6月18日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

最近做了一个给文章配图的 Codex Skill,让文章配图变成可复用的视觉系统

发布日期:2026-06-17 19:40:15 浏览次数: 1529
作者:卡森羊

微信搜一搜,关注“卡森羊”

推荐语

告别文章配图风格混乱、角色不一的烦恼,这个Codex Skill帮你构建专属视觉IP系统。

核心内容:
1. 解决传统AI配图风格、角色、表达不稳定的痛点
2. 支持小黑、小盒、Ferris等六大视觉IP路线,适配不同文章主题
3. 提供从插图规划到PNG生成的全流程,实现视觉语言长期复用

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

SKILL


最近我一直在打磨一个 skill,它解决的是一个很具体的问题:写文章时配图很麻烦

很多 AI 画图工具都能生成好看的配图,但真正放进文章里时,会遇到几个问题:

  • 风格不稳定。同一篇文章里,第一张像手绘,第二张像商业海报,第三张又变成 3D 渲染。
  • 角色不稳定。你想用同一个小人贯穿全文,但每次生成出来都像换了一个人。
  • 表达不稳定。文章真正想讲的是一个判断、流程、坑点、取舍,图片却容易变成泛泛的装饰图。

所以我做了这个 Codex Skill(基于原版小黑 skill 进行二开)。

它的思路很简单:先读文章,找到里面最适合视觉化的认知锚点,再把这个锚点转换成文章插图。

它现在支持多个视觉 IP 路线:

  • 小黑:默认路线,适合方法论、判断、流程、系统视角
  • 小盒:纸盒角色,适合整理、收纳、交付、修补类隐喻
  • Ferris:Rust 社区吉祥物路线,适合 Rust、系统工程、可靠性主题
  • Go Gopher:Go 语言吉祥物路线,适合 Go 技术文章
  • Seal:连帽衫海豹,适合产品中立、评审、优先级、协作主题
  • OpenClaw:适合 OpenClaw 相关工作流和项目解释
Xiaohei
Littlebox
Tom
Ferris
Seal
OpenClaw
Go Gopher

当然,任意文章都可以使用任意 IP 形象,没有什么标准,看你喜好。

它输出的东西也比较完整:

一篇文章可以生成 4 到 8 张插图规划。每张图会包含放置位置、画面主题、核心意思、角色动作、可见文字标签,最后再生成 PNG 图片。

优点有两个:

第一,插图服务于文章内容。

它优先画清楚一个判断、一个流程、一个状态变化,而不是单纯追求好看。

第二,视觉 IP 可以长期复用。

当一个角色在多篇文章里反复出现,读者会慢慢建立熟悉感。对个人写作者、技术博客、产品团队来说,这种稳定的视觉语言会很有用。

安装方法:

npx skills add yangchuansheng/visual-ip-illustrations --skill visual-ip-illustrations

使用方式也很直接,直接在 Codex 里调用:

$visual-ip-illustrations

然后把文章内容和想用的视觉 IP 交给它即可。

比如你可以说:

  • “用小黑给这篇文章生成 6 张正文插图。”
  • “用 Go Gopher 给这篇 Go 技术文章做插图。”
  • “用 Ferris 做一组 Rust 编译流程的解释图。”

我把它开源出来,主要想看看大家在真实写作场景里会怎么用。

如果你经常写技术文章、产品文章、方法论文章,可以试试看,也欢迎直接提 issue 或 PR。

GitHub:https://github.com/yangchuansheng/visual-ip-illustrations

配图这件事,未来应该会从一次性生成,慢慢变成一套可复用的视觉系统。这个项目就是朝这个方向做的一次尝试。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询