微信扫码
添加专属顾问
我要投稿
科研人的福音!Paper2Slides让论文转PPT从耗时半天缩短到1分钟,还能保持学术严谨与设计精美。 核心内容: 1. 一键生成学术级幻灯片的三大核心突破 2. 支持多格式输入与风格自定义的实用细节 3. 基于RAG技术的精准信息提取架构解析
Paper2Slides 的好用,体现在它把 “精准” 和 “灵活” 做到了极致,这些亮点值得重点说:
很多人用工具只看表面,其实 Paper2Slides 的架构设计,才是它能精准生成内容的关键。我把它的核心流程拆成了 4 个阶段,用通俗的话讲清楚:
不管是 PDF 还是 Word,第一步都是转换成统一的 Markdown 格式,同时专门提取表格、图片、公式 —— 比如把论文里的表格转成 HTML 格式保留原始数据,公式保留 LaTeX 代码,图片记录位置和描述。这一步的核心是 “结构化”,为后续 AI 处理打下基础,避免 AI 只认文字、丢了图表的问题。
普通 AI 生成内容容易 “瞎编”,但 Paper2Slides 用了 RAG(检索增强生成):先把解析后的论文内容做索引,当需要生成某一页幻灯片时,AI 会先从索引里检索对应的原文内容,再基于检索结果整理,而不是凭空生成。这就保证了内容 100% 来自论文,不会遗漏关键数据、公式,也不会出现信息漂移。
这是最核心的一步,项目里专门写了上千行的 LLM 提示词(prompt),规定了幻灯片的结构:
简单说,就是用精准的 prompt 约束 AI,让它按照学术幻灯片的逻辑,把论文内容拆分成一页页有标题、有细节、有图表的幻灯片框架。
最后一步是把 AI 规划的内容,按指定样式(比如哆啦 A 梦风、学术风)渲染成 PDF 格式的幻灯片 / 海报。项目里内置了样式模板,也支持自然语言自定义样式,比如你说 “想要清新的蓝色系,标题用黑体,内容用宋体”,AI 会按这个要求调整格式。
Paper2Slides 的技术栈都是当下 AI 工程化的主流选型,整理成清单给大家,顺便埋个小彩蛋👇:
这些技术栈覆盖了 AI 应用开发的核心环节,把这个项目吃透,不管是进大厂做 AI 应用,还是接外包做定制化工具,都够用了。
Paper2Slides 不是 “小众玩具”,而是能落地的实用工具,这些场景都能用上:
不管是想体验还是二次开发,本地部署都很简单,分 Docker 和原生两种方式,推荐 Docker(跨平台无坑):
# 打开终端,进入想要存放项目的目录cd C:\Users\你的用户名\Documents# 克隆仓库git clone https://github.com/HKUDS/Paper2Slides.git# 进入项目目录cd Paper2Slides
3. 配置环境变量
# 复制示例.env文件copy paper2slides\.env.example paper2slides\.env# 编辑.env文件,添加API密钥(OpenAI/DeepSeek/Gemini至少填一个)# 比如:OPENAI_API_KEY=你的密钥
4. 启动服务
# 启动Docker容器(从项目根目录运行)docker-compose -f docker/docker-compose.yml up -d# 查看日志,确认启动成功docker-compose -f docker/docker-compose.yml logs -f
据圈内朋友透露,Paper2Slides 后续可能会更新这些功能:
虽然还没官宣,但这些方向都很贴合用户需求,值得期待。
Paper2Slides 之所以能火,本质是它把 “AI 提效” 落到了实处 —— 不是简单的文本生成,而是结合 RAG 解决 “精准性”,结合 Prompt 解决 “结构化”,结合工程化设计解决 “易用性”。
对我们开发者来说,这个项目不仅能拿来直接用,更能学习到 “如何把 AI 能力落地成实用工具”:比如怎么用 RAG 保证内容精准,怎么写高质量的 Prompt 约束 AI 输出,怎么设计断点续传、并行处理这些工程化细节。
如果你是科研人,它能帮你省下做幻灯片的时间;
如果你是开发者,它是学习 AI 应用开发的绝佳案例。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-03
Claude Code——智能路由与切换工具
2026-02-03
作为投资方,我们试了试Kimi K2.5
2026-02-03
暴涨11.7k Star!复刻Manus上下文工程的开源Skills,Claude code等多个平台即插即用
2026-02-03
ollama v0.15.4 更新:OpenClaw全面上线,优化集成流程与工具解析能力大升级!
2026-02-03
阶跃星辰 Step 3.5 Flash 上线!更快更强更稳的 Agent 大脑,开源!
2026-02-02
一分钟部署OpenClaw+QQ,国内最爽的一键启动!
2026-02-02
这家字节系AI初创,推出首个开源Agent Skills Builder!对话Refly.AI李锦威:大多数Agent都停留在专业用户层面,没有做到真正的普惠
2026-02-02
OCR又出宠OpenDoc,速度超MinerU6倍
2025-11-19
2026-01-27
2025-12-22
2025-12-10
2025-11-17
2026-01-12
2025-11-07
2025-12-23
2026-01-06
2026-01-29
2026-01-28
2026-01-26
2026-01-21
2026-01-21
2026-01-20
2026-01-16
2026-01-02
2025-12-24