我要投稿

AI辅助研究和工具实践03-Gemini3Pro+NotebookLM专题

发布日期：2026-01-18 17:07:10 浏览次数： 2068

作者：人月聊IT

微信搜一搜，关注“人月聊IT”

今天继续分享AI辅助工具使用方面的一些研究和实践，在今年的6月份我当时分享过一篇文章，对个人使用的AI工具进行了详细说明，当时输出了一张思维导图具体如下：

具体可以参考历史文章：

AI辅助工具研究和实践

今天重点想分享下最近我使用Google Gemini3 pro + NotebookLM+ NanaBanana方面的一些个人总结。

首先我强烈建议大家购买一个Google Gemini3pro的账号，这个账号不仅仅是我使用NotebookLM输出的时候没有再受到额度的限制。关键是这个账号本身还带了NanoBanana绘图，Google AntiGravitiy反重力IDE的AI编程工具使用。而且这个AI编程工具本身对接了Gemini3pro, Claude4.5 Sonnet + Opus我们常用的大模型，额度基本每5小时就会刷新一次，基本完全够用。再次强烈推荐大家购买这个账号，具体不清楚如何购买的可以自己网上搜索下。

1.Google Gemini DeepResearch

再次推荐使用Google Gemini的深度研究功能。特别适合用于做市场调研分析，技术研究，产品规划，行业研究等方面的内容。而且研究内容足够详细。我在前面就谈到过，类似这种行业研究，学术研究方面，DeepResearch基本就是遥遥领先的状态。

我最近刚好又使用该功能做了一个产品规划报告。

注意这里面就有一个关键的小技巧：就是你可以将你已有的产品文档，产品分析报告，现状类文档等，通过附件的方式上传给Gemini，那么这个时候，DeepResearch深度研究的输出就是完全结合你现状情况的一份输出，更加具备了研究报告的针对性。

这个时候Google会输出完整的产品规划和市场分析报告。

当然这个时候我们可以将该报告导入到Google Notebooklm中，让NotebookLM输出一份完整的PPT给我。具体参考如下：

上面例子大家注意关键点。

其一是大语言模型擅长归纳和内容生成，而类似Notebooklm更加擅长已有内容的形象化演绎和表达。一个是扩写，一个是高度收缩。要给是内容内在逻辑结构，一个是可视化形象表达。那么组合起来一个可以参考的核心思路就是：可以先让DeepResearch生成8000到10000字的研究报告，然后再导入到AI笔记让Notebooklm输出信息图或PPT或口播，或讲解视频。

2.Google NotebookLM

大家可能看我最近发布了不少通过AI输出的信息图。但是在这里首先强调一个关键点就是没有完整，丰富的内容，包括已有内容本身就具备了很好的逻辑结构。那么就不可能输出很好的信息图。结构化和体现内在逻辑的长内容是生成优质信息图的基础。

那么我输出的信息图，一般的思路是将我数字化，思维，学习，问题分析解决，企业架构等个人原创的文章先导入到NotebookLM，然后再让AI基于某一个主题当我输出一个完整的信息图。

而信息图输出，我一般采用的风格只有两种。

提示1: 输出手绘风格，奶油风格信息图，色彩柔和
提示2: 输出商务风格，大型咨询公司风格信息图

当然你还可以让AI输出类似绘本风格，中国水墨风格，科技风格各种信息图。在信息图中我一般会加入一句就是体现内容逻辑结构，知识点之间的关联和集成关系，体现核心的逻辑顺序和时间脉络等。类似我前两天基于Human3.0个人评估模型输出的一种信息图如下：

所以大家要看到只要内容信息量足够，一定可以输出好看的信息图。

当然对于PPT的输出是我个人用的最多的一个功能，最常用的还是输出一个手绘风格，奶油风的PPT，内容完整，逻辑清晰。

大家可能会觉得为啥我输出的PPT里面有很多逻辑图，其实核心的一个原因就是我投喂给NotebookLM的我的历史文章中本来就有很多我用ppt和visio画的逻辑示意图。AI可以很好的理解我原来的构图并重新绘制。这个也是Notebooklm的AI笔记相对强大的一个地方。

但是采用NotebookLM输出PPT的时候一般只有15页，但是涉及到思维，数字化，云原生相关的内容，实际很难在15页完全讲清楚。因此在这里我们需要进行分章节构建。即告诉AI我们准备输出一个完整的方案文档，一共分几章，然后这次你先帮我输出第几章的内容即可。

具体参考提示词：

我准备做一个从企业数字化转型到云原生的方案PPT材料。当前我准备分为五个子PPT来制作。具体为：1. 数字化和企业数字化转型概述（包括数字化本质，数字化转型连接数据智能三要素，数据驱动等）2. 企业数字化转型方法论介绍3. 以企业架构为核心的数字化转型（重点介绍4A架构在数字化转型中的支撑作用）4. 构建云原生技术底座（介绍云原生整体解决方案，包括低代码，DevOps，IPaaS，容器云，微服务开发框架展开）5. 构建敏捷的微服务应用架构（介绍微服务，微服务拆分，微服务开发框架，微服务应用开发，微服务集成，微服务治理等）现在请先帮我基于知识库相关材料生成第4章《云原生技术底座》。该PPT采用大咨询公司咨询方案风格，商务风格。注意和前面生成的章节风格匹配。

那么我们输出的PPT类似如下：

注意在这里，我们给出两套我重新优化调整后的PPT制造模板风格。

参考模板风格1：

PPT的核心模板格式要求如下

1. 主色：背景色为白色。深红色/酒红色 (#8B0000)，对比色 暗板岩蓝色 （#1C400B），辅助色可以用浅灰色。2. 注意上面谈到的酒红色 (#8B0000)，暗板岩蓝色 （#1C400B）只用于形状背景，当这两种颜色为背景时候字体为白色。其余时候字体为黑色。2. 整体风格：大咨询公司PPT风格，商务风格，专业咨询方案3. 布局要求：整体不分割，或左右分栏；或上下分栏（但是上部只占1/5高度，约2行文字），或卡片式模块化涉及，适度留白4. 视角元素：表格化，列表，可视化图表（类似架构图，集成图，流程图，逻辑关系图，雷达图，金字塔图，矩阵图，柱状图，折线图，PDCA循环图等）5. 逻辑说明：符号MECE法则，金字塔原理，SCQA叙述，总分总叙述，问题-分析-解决方案-实施方法论，归纳演绎逻辑6. 内容页布局：上方12%空间为标题栏，标题24px，左对齐，标题下方有一条暗板岩蓝色横向贯穿分割线（2px)，正文部分字体在14到18px之间。标题字体加粗，黑色。 7. 采用中文字体（思源黑体/微软雅黑）8. 如果知识库中有相应的构图，你可以在输出ppt的时候参考我原来的构图方式。

参考模板风格2：

1. 主色：背景色为白色。深红色/酒红色 (#8B0000)，对比色 暗板岩蓝色 （#1C400B），辅助色可以用浅灰色。2. 注意上面谈到的酒红色 (#8B0000)，暗板岩蓝色 （#1C400B）只用于形状背景，当这两种颜色为背景时候字体为白色。其余时候字体为黑色。2. 整体风格：大咨询公司PPT风格，商务风格，专业咨询方案3. 布局要求：整体不分割，或左右分栏；或上下分栏（但是上部只占1/5高度，约2行文字），或卡片式模块化涉及，适度留白4. 视角元素：表格化，列表，可视化图表（类似雷达图，金字塔图，矩阵图，柱状图，折线图，PDCA循环图等）5. 逻辑说明：符号MECE法则，金字塔原理，SCQA叙述，总分总叙述，问题-分析-解决方案-实施方法论，归纳演绎逻辑6. 内容页布局：上方12%空间为标题栏，标题24px，左对齐，标题下方有一条暗板岩蓝色横向贯穿分割线（2px)，正文部分字体在14到18px之间。标题字体加粗，黑色。 7. 采用中文字体（思源黑体/微软雅黑）8. 我如果知识库中有相应的构图，你可以在输出ppt的时候参考我原来的构图方式。

好了，接着问题来了。

在Notebooklm里面，我们还可以让AI基于我们知识库的内容帮我们生成一个单人或双人口播的音频，或者让AI帮我们生成一个配合PPT讲解的视频。但是这里就有问题了。

如果是音频，你会发现双人讲解的音频内容可能和你前面输出的PPT的内容并没有一一对应，不论是内容还是讲解顺序上。如果直接输出视频，但是视频里面的PPT页面并不是你但是输出的PPT里面的页面。也就是Notebooklm上面的几种演绎形式上面并没有做到很好的同步。

那么我如何处理这个问题？在这个给出一个参考方法。

首先我们还是会让AI帮我输出一个完整的PPT，让后将该PPT导出为PDF文件后，重新将该PDF文件上传到AI笔记库。然后让AI完全基于这个pdf文件，包括页面顺序来帮我输出一个完整的口播音频。最后将口播的音频和PPT内容都导出到本地，在类似剪映等工具里面自己进一步进行合成。大家可以参考下我视频号最近发布的一个关于认知的视频即采用这种方式来完成。如果有更好的做法大家也可以留言评论。

注意，当前的AI笔记是可以直接添加视频超链接地址的。类似我可以直接将我B站视频连接地址添加进来。