2026年3月27日,来腾讯会议(限30人)了解掌握如何用Openclaw构建企业AI生产力
免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

拒绝熬夜!OpenClaw + Nano Banana 2 打造“一句话生成”PPT 的全自动工厂

发布日期:2026-03-19 19:02:18 浏览次数: 1559
作者:后端小肥肠

微信搜一搜,关注“后端小肥肠”

推荐语

一句话生成精美PPT,告别熬夜加班!OpenClaw + Nano Banana 2帮你实现全自动PPT制作。

核心内容:
1. 从一句话需求到精美PPT的全自动化流程
2. 系统三层架构设计及核心技术栈解析
3. 实战演示如何将文档/一句话转化为专业PPT

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

大家好我是小肥肠,今天给大家带来的教程是  OpenClaw +  Nano Banana 2实现 AI 自动生成 PPT 的完整方案。这套系统可以让你用一句话描述需求,AI 就能帮你生成一份排版精美、配图专业的演示文稿,从大纲规划到页面设计全程自动化。

dify" data-id="MzI0OTc5OTM1MQ==" data-is_biz_ban="0" data-service_type="1" data-verify_status="1">

1. 前言

在日常工作中,制作 PPT 往往是最耗时的环节之一:构思大纲要半小时,撰写内容要一小时,找配图排版又要一小时。 更痛苦的是,很多时候我们脑子里有想法,但落到页面上就是不对劲。

今天这套方案通过  OpenClaw +  Nano Banana 2实现了从「一句话需求」「精美 PPT」的全自动化流程。先看一下效果:

我做的case是让它提取飞书文档内容生成PPT,输入指令「飞书文档链接」紧贴文档,生成ppt

等待几分钟PPT就生成好了:

ppt成果展示:

我不太喜欢科技风,而且生成的页数也很少,让它改成了小红书知识卡片风格的、增加PPT页数到10页、加上我的logo水印。

ppt成果展示:

2. 技术栈介绍及架构设计

2.1. banana-slides介绍

OpenClaw +  Nano Banana 2生成PPT系统,底层依赖的是banana-slides (仓库地址:https://github.com/Anionex/banana-slides)。

banana-slides是一个基于 nano banana pro 的原生 AI PPT 生成应用,目标是实现真正的 "Vibe PPT"  从想法到演示文稿只需几分钟,无需繁琐排版,可以口头提出修改意见。它的核心能力梳理如下图:

2.2. 系统架构设计

OpenClaw + Nano Banana 2生成PPT系统采用三层架构,这样设计的好处是职责清晰易于扩展

交互层

用户通过飞书机器人发送自然语言指令,比如:帮我做一份关于 AI 发展史的 PPT,要有科技感

调度层

OpenClaw 作为中枢大脑,负责理解用户意图,拆解任务;调用 banana-slides 生成大纲和页面描述;调度 Nano Banana 2批量生成配图;汇总结果并反馈给用户。

执行层涵盖三大模块

  • banana-slides:负责 PPT 结构规划、内容生成、页面排版
  • nano-banana-2:负责根据页面描述生成高质量配图
  • 导出模块:将页面图片组装成标准 PPTX 文件

3. 完整工作流实战

前面我们已经介绍了整体思路和技术架构,接下来就进入最关键的实战部分:如何把 banana-slides 封装成一个 Claude/OpenClaw 可调用的 Skill,并真正跑通 “文档/一句话 -> PPT” 这条链路。

3.1. xfc-ppt构建

3.1.1 目录框架搭建

xfc-ppt是一个claude code项目。为了让它既保留 banana-slides 的原始能力,又具备技能化调用能力,我采用了下面这套目录结构:

xfc-ppt/
├── SKILL.md          # 必填:使用说明 + 元数据
├── scripts/          # 必填:可执行代码
└── config.json       # 必填:配置文件,配置第三方平台key
└── banana-slides-main/           #  banana-slides-main项目
└── output/           # 项目输出目录(可配置将ppt输出到此目录)

按照设计结构创建对应文件夹和文件,其中banana-slides-main需要去仓库下载后放入对应路径。

这样设计目录的好处是:Skill 负责 “怎么调用” ,banana-slides 负责 “怎么生成” 。两者边界清晰,后续维护也更轻松。

3.1.2 编写SKILL.md

SKILL.md 是这个项目最重要的 “入口说明书” ,它决定了 OpenClaw 看到用户需求后,能不能正确识别应该调用哪个 Skill,以及调用后应该走什么流程。

以下是SKILL.md编写思路,可投喂给AI扩写为完整的SKILL.md

1. 定义元数据(围绕Vibe PPT主题编写)
2. 定义调度规则,核心还是调度banana-slides生成PPT
3. 定义触发条件
- 用户发送文档资料要求总结为PPT
- 把已有的PPT翻新为新的幻灯片
- 给定主题生成PPT
4. 指定每个流程需要调用的代码
- 调用banana-slides-main生成PPT大纲与内容
- 调用generate.py生图

3.1.3 编写scripts/generate.py

如果说 SKILL.md 是协议层,那么 generate.py 更像是一个轻量执行脚本。它目前主要承担本地化生图适配职责:读取配置、调用国内可用的 Nano Banana 2 兼容接口、下载并保存生成图片。

在这里,我做了一个至关重要的本地化改动:

原始的 banana-slides-main 项目默认调用是国外的生图接口,这对于我们国内用户来说存在网络门槛。因此,我将 request_image() 模块中的生图接口替换为了 Nano Banana 2对接了国内三方网站。

核心代码结构(可投喂给豆包进行生成):

load_config()
  读取 config.json 配置文件

resolve_settings()
  从 config.json / 环境变量获取:
    api_key
    api_url
    model

build_output_dir()
  创建并返回 output 输出目录

request_image()
  发送 prompt 到生图接口
  解析返回结果
  取出图片 url

download_image()
  下载图片
  按时间戳命名
  保存到本地

main()
  读取命令行参数
  解析配置
  创建输出目录
  调用生图接口
  下载图片到 output
  输出文件路径

3.2. xfc-ppt集成到OpenClaw

完成 Skill 本体后,下一步就是把它真正接入 OpenClaw,这一部分的目标,是让用户在飞书或其他对话入口里,不再手动操作脚本,而是直接用自然语言触发整个流程。

上传以后需要二次确认skill的存在:

然后就能像前言那样开启Vibe PPT之旅了。在整个系统里,OpenClaw 不是 PPT 生成器,它更像一个 “总调度台” 。它负责:

  • 接收用户消息
  • 判断用户意图
  • 识别是否该调用 xfc-ppt
  • 把用户输入转成 Skill 可执行参数
  • 等待任务完成并返回结果

以上就是OpenClaw +Nano Banana 2生成PPT系统的全部内容,动手能力强的读者可以跟着教程实践一遍。上述skill已经被收录到了小肥陪跑群中,需要原件可以加入社群直接使用哦。


4. 结语

我建了一个AI智能体共学群,助力大家能快速上手AI工具,之前群内的主题是Coze和n8n,现在已经调整为了OpenClaw+AgentSkills。加入共学群的朋友还可同步被拉入Coze团队空间,获取我过去分享过的各类工作流文件,从初级到高级一应俱全,帮助你更快掌握使用技巧,想了解共学群的友友可以扫码添加小肥肠微信进行详细了解。

#OpenClaw #OpenClaw实战 #NanoBanana2 #PPT

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询