微信扫码
添加专属顾问
我要投稿
一句话生成精美PPT,告别熬夜加班!OpenClaw + Nano Banana 2帮你实现全自动PPT制作。核心内容:1. 从一句话需求到精美PPT的全自动化流程2. 系统三层架构设计及核心技术栈解析3. 实战演示如何将文档/一句话转化为专业PPT
大家好我是小肥肠,今天给大家带来的教程是 OpenClaw + Nano Banana 2实现 AI 自动生成 PPT 的完整方案。这套系统可以让你用一句话描述需求,AI 就能帮你生成一份排版精美、配图专业的演示文稿,从大纲规划到页面设计全程自动化。
在日常工作中,制作 PPT 往往是最耗时的环节之一:构思大纲要半小时,撰写内容要一小时,找配图排版又要一小时。 更痛苦的是,很多时候我们脑子里有想法,但落到页面上就是不对劲。
今天这套方案通过 OpenClaw + Nano Banana 2实现了从「一句话需求」到「精美 PPT」的全自动化流程。先看一下效果:
我做的case是让它提取飞书文档内容生成PPT,输入指令「飞书文档链接」紧贴文档,生成ppt。
等待几分钟PPT就生成好了:
ppt成果展示:
我不太喜欢科技风,而且生成的页数也很少,让它改成了小红书知识卡片风格的、增加PPT页数到10页、加上我的logo水印。
ppt成果展示:
OpenClaw + Nano Banana 2生成PPT系统,底层依赖的是banana-slides (仓库地址:https://github.com/Anionex/banana-slides)。
banana-slides是一个基于 nano banana pro 的原生 AI PPT 生成应用,目标是实现真正的 "Vibe PPT" , 从想法到演示文稿只需几分钟,无需繁琐排版,可以口头提出修改意见。它的核心能力梳理如下图:
OpenClaw + Nano Banana 2生成PPT系统采用三层架构,这样设计的好处是职责清晰和易于扩展:
交互层
用户通过飞书机器人发送自然语言指令,比如:帮我做一份关于 AI 发展史的 PPT,要有科技感。
调度层
OpenClaw 作为中枢大脑,负责理解用户意图,拆解任务;调用 banana-slides 生成大纲和页面描述;调度 Nano Banana 2批量生成配图;汇总结果并反馈给用户。
执行层涵盖三大模块
banana-slides:负责 PPT 结构规划、内容生成、页面排版nano-banana-2:负责根据页面描述生成高质量配图导出模块:将页面图片组装成标准 PPTX 文件前面我们已经介绍了整体思路和技术架构,接下来就进入最关键的实战部分:如何把 banana-slides 封装成一个 Claude/OpenClaw 可调用的 Skill,并真正跑通 “文档/一句话 -> PPT” 这条链路。
xfc-ppt是一个claude code项目。为了让它既保留 banana-slides 的原始能力,又具备技能化调用能力,我采用了下面这套目录结构:
xfc-ppt/
├── SKILL.md # 必填:使用说明 + 元数据
├── scripts/ # 必填:可执行代码
└── config.json # 必填:配置文件,配置第三方平台key
└── banana-slides-main/ # banana-slides-main项目
└── output/ # 项目输出目录(可配置将ppt输出到此目录)
按照设计结构创建对应文件夹和文件,其中banana-slides-main需要去仓库下载后放入对应路径。
这样设计目录的好处是:Skill 负责 “怎么调用” ,banana-slides 负责 “怎么生成” 。两者边界清晰,后续维护也更轻松。
SKILL.md 是这个项目最重要的 “入口说明书” ,它决定了 OpenClaw 看到用户需求后,能不能正确识别应该调用哪个 Skill,以及调用后应该走什么流程。
以下是SKILL.md编写思路,可投喂给AI扩写为完整的SKILL.md:
1. 定义元数据(围绕Vibe PPT主题编写)
2. 定义调度规则,核心还是调度banana-slides生成PPT
3. 定义触发条件
- 用户发送文档资料要求总结为PPT
- 把已有的PPT翻新为新的幻灯片
- 给定主题生成PPT
4. 指定每个流程需要调用的代码
- 调用banana-slides-main生成PPT大纲与内容
- 调用generate.py生图
如果说 SKILL.md 是协议层,那么 generate.py 更像是一个轻量执行脚本。它目前主要承担本地化生图适配职责:读取配置、调用国内可用的 Nano Banana 2 兼容接口、下载并保存生成图片。
在这里,我做了一个至关重要的本地化改动:
原始的 banana-slides-main 项目默认调用是国外的生图接口,这对于我们国内用户来说存在网络门槛。因此,我将 request_image() 模块中的生图接口替换为了 Nano Banana 2对接了国内三方网站。
核心代码结构(可投喂给豆包进行生成):
load_config()
读取 config.json 配置文件
resolve_settings()
从 config.json / 环境变量获取:
api_key
api_url
model
build_output_dir()
创建并返回 output 输出目录
request_image()
发送 prompt 到生图接口
解析返回结果
取出图片 url
download_image()
下载图片
按时间戳命名
保存到本地
main()
读取命令行参数
解析配置
创建输出目录
调用生图接口
下载图片到 output
输出文件路径
完成 Skill 本体后,下一步就是把它真正接入 OpenClaw,这一部分的目标,是让用户在飞书或其他对话入口里,不再手动操作脚本,而是直接用自然语言触发整个流程。
上传以后需要二次确认skill的存在:
然后就能像前言那样开启Vibe PPT之旅了。在整个系统里,OpenClaw 不是 PPT 生成器,它更像一个 “总调度台” 。它负责:
xfc-ppt以上就是OpenClaw +Nano Banana 2生成PPT系统的全部内容,动手能力强的读者可以跟着教程实践一遍。上述skill已经被收录到了小肥陪跑群中,需要原件可以加入社群直接使用哦。
我建了一个AI智能体共学群,助力大家能快速上手AI工具,之前群内的主题是Coze和n8n,现在已经调整为了OpenClaw+AgentSkills。加入共学群的朋友还可同步被拉入Coze团队空间,获取我过去分享过的各类工作流文件,从初级到高级一应俱全,帮助你更快掌握使用技巧,想了解共学群的友友可以扫码添加小肥肠微信进行详细了解。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-03-19
优刻得首发接入NemoClaw:面向企业的可控Agent运行体系
2026-03-19
我在 OpenClaw 里发现了一个新商业闭环
2026-03-19
GPT-5.4发布24小时,OpenClaw🦞最新配置教程!
2026-03-19
QClaw养虾教程|我把OpenClaw装进了微信,无痛搞定 Milvus 运维巡检
2026-03-19
用OpenClaw裁掉40%员工后,他说:我们需要更多“圣母型”人才
2026-03-19
OpenClaw企业落地的5个进阶配置,价值千亿的市场机会
2026-03-19
一文总结飞书新品发布会 - 向Agent平台的跃迁。
2026-03-19
【养虾人必读】告别黑盒!让你的 OpenClaw 像水晶一样透明
2026-03-05
2026-02-17
2026-03-03
2026-02-06
2026-02-03
2026-02-16
2026-02-10
2026-03-09
2026-03-09
2026-02-06