免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

AI辅助研究和工具实践03-Gemini3Pro+NotebookLM专题

发布日期:2026-01-18 17:07:10 浏览次数: 1516
作者:人月聊IT

微信搜一搜,关注“人月聊IT”

推荐语

探索AI辅助研究新高度:Gemini3Pro+NotebookLM强强联合,打造高效知识生产流水线。

核心内容:
1. Google Gemini3Pro账号的独特优势与配套工具链
2. DeepResearch深度研究功能在专业领域的应用技巧
3. NotebookLM与Gemini协同的内容生产方法论

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
Hello,大家好,我是人月聊IT。
今天继续分享AI辅助工具使用方面的一些研究和实践,在今年的6月份我当时分享过一篇文章,对个人使用的AI工具进行了详细说明,当时输出了一张思维导图具体如下:
图片

具体可以参考历史文章:

AI辅助工具研究和实践
今天重点想分享下最近我使用Google Gemini3 pro + NotebookLM+ NanaBanana方面的一些个人总结。
首先我强烈建议大家购买一个Google Gemini3pro的账号,这个账号不仅仅是我使用NotebookLM输出的时候没有再受到额度的限制。关键是这个账号本身还带了NanoBanana绘图,Google AntiGravitiy反重力IDE的AI编程工具使用。而且这个AI编程工具本身对接了Gemini3pro, Claude4.5 Sonnet + Opus我们常用的大模型,额度基本每5小时就会刷新一次,基本完全够用。再次强烈推荐大家购买这个账号,具体不清楚如何购买的可以自己网上搜索下。
1.Google Gemini DeepResearch
再次推荐使用Google Gemini的深度研究功能。特别适合用于做市场调研分析,技术研究,产品规划,行业研究等方面的内容。而且研究内容足够详细。我在前面就谈到过,类似这种行业研究,学术研究方面,DeepResearch基本就是遥遥领先的状态。
我最近刚好又使用该功能做了一个产品规划报告。
注意这里面就有一个关键的小技巧:就是你可以将你已有的产品文档,产品分析报告,现状类文档等,通过附件的方式上传给Gemini,那么这个时候,DeepResearch深度研究的输出就是完全结合你现状情况的一份输出,更加具备了研究报告的针对性。
这个时候Google会输出完整的产品规划和市场分析报告。
当然这个时候我们可以将该报告导入到Google Notebooklm中,让NotebookLM输出一份完整的PPT给我。具体参考如下:
上面例子大家注意关键点。
其一是大语言模型擅长归纳和内容生成,而类似Notebooklm更加擅长已有内容的形象化演绎和表达。一个是扩写,一个是高度收缩。要给是内容内在逻辑结构,一个是可视化形象表达。那么组合起来一个可以参考的核心思路就是:可以先让DeepResearch生成8000到10000字的研究报告,然后再导入到AI笔记让Notebooklm输出信息图或PPT或口播,或讲解视频。
2.Google NotebookLM
大家可能看我最近发布了不少通过AI输出的信息图。但是在这里首先强调一个关键点就是没有完整,丰富的内容,包括已有内容本身就具备了很好的逻辑结构。那么就不可能输出很好的信息图。结构化和体现内在逻辑的长内容是生成优质信息图的基础。
那么我输出的信息图,一般的思路是将我数字化,思维,学习,问题分析解决,企业架构等个人原创的文章先导入到NotebookLM,然后再让AI基于某一个主题当我输出一个完整的信息图。
而信息图输出,我一般采用的风格只有两种。
  • 提示1: 输出手绘风格,奶油风格信息图,色彩柔和
  • 提示2: 输出商务风格,大型咨询公司风格信息图

当然你还可以让AI输出类似绘本风格,中国水墨风格,科技风格各种信息图。在信息图中我一般会加入一句就是体现内容逻辑结构,知识点之间的关联和集成关系,体现核心的逻辑顺序和时间脉络等。类似我前两天基于Human3.0个人评估模型输出的一种信息图如下:
所以大家要看到只要内容信息量足够,一定可以输出好看的信息图。
当然对于PPT的输出是我个人用的最多的一个功能,最常用的还是输出一个手绘风格,奶油风的PPT,内容完整,逻辑清晰。
大家可能会觉得为啥我输出的PPT里面有很多逻辑图,其实核心的一个原因就是我投喂给NotebookLM的我的历史文章中本来就有很多我用ppt和visio画的逻辑示意图。AI可以很好的理解我原来的构图并重新绘制。这个也是Notebooklm的AI笔记相对强大的一个地方。
但是采用NotebookLM输出PPT的时候一般只有15页,但是涉及到思维,数字化,云原生相关的内容,实际很难在15页完全讲清楚。因此在这里我们需要进行分章节构建。即告诉AI我们准备输出一个完整的方案文档,一共分几章,然后这次你先帮我输出第几章的内容即可。
具体参考提示词:
我准备做一个从企业数字化转型到云原生的方案PPT材料。当前我准备分为五个子PPT来制作。具体为:1. 数字化和企业数字化转型概述(包括数字化本质,数字化转型连接数据智能三要素,数据驱动等)2. 企业数字化转型方法论介绍3. 以企业架构为核心的数字化转型(重点介绍4A架构在数字化转型中的支撑作用)4. 构建云原生技术底座(介绍云原生整体解决方案,包括低代码,DevOps,IPaaS,容器云,微服务开发框架展开)5. 构建敏捷的微服务应用架构(介绍微服务,微服务拆分,微服务开发框架,微服务应用开发,微服务集成,微服务治理等)现在请先帮我基于知识库相关材料生成第4章《云原生技术底座》。该PPT采用大咨询公司咨询方案风格,商务风格。注意和前面生成的章节风格匹配。

那么我们输出的PPT类似如下:

注意在这里,我们给出两套我重新优化调整后的PPT制造模板风格。

参考模板风格1:

PPT的核心模板格式要求如下

1. 主色:背景色为白色。深红色/酒红色 (#8B0000),对比色 暗板岩蓝色 (#1C400B),辅助色可以用浅灰色。2. 注意上面谈到的酒红色 (#8B0000),暗板岩蓝色 (#1C400B)只用于形状背景,当这两种颜色为背景时候字体为白色。其余时候字体为黑色。2. 整体风格:大咨询公司PPT风格,商务风格,专业咨询方案3. 布局要求:整体不分割,或左右分栏;或上下分栏(但是上部只占1/5高度,约2行文字),或卡片式模块化涉及,适度留白4. 视角元素:表格化,列表,可视化图表(类似架构图,集成图,流程图,逻辑关系图,雷达图,金字塔图,矩阵图,柱状图,折线图,PDCA循环图等)5. 逻辑说明:符号MECE法则,金字塔原理,SCQA叙述,总分总叙述,问题-分析-解决方案-实施方法论,归纳演绎逻辑6. 内容页布局:上方12%空间为标题栏,标题24px,左对齐,标题下方有一条暗板岩蓝色横向贯穿分割线(2px),正文部分字体在14到18px之间。标题字体加粗,黑色。 7. 采用中文字体(思源黑体/微软雅黑)8. 如果知识库中有相应的构图,你可以在输出ppt的时候参考我原来的构图方式。

参考模板风格2:

1. 主色:背景色为白色。深红色/酒红色 (#8B0000),对比色 暗板岩蓝色 (#1C400B),辅助色可以用浅灰色。2. 注意上面谈到的酒红色 (#8B0000),暗板岩蓝色 (#1C400B)只用于形状背景,当这两种颜色为背景时候字体为白色。其余时候字体为黑色。2. 整体风格:大咨询公司PPT风格,商务风格,专业咨询方案3. 布局要求:整体不分割,或左右分栏;或上下分栏(但是上部只占1/5高度,约2行文字),或卡片式模块化涉及,适度留白4. 视角元素:表格化,列表,可视化图表(类似雷达图,金字塔图,矩阵图,柱状图,折线图,PDCA循环图等)5. 逻辑说明:符号MECE法则,金字塔原理,SCQA叙述,总分总叙述,问题-分析-解决方案-实施方法论,归纳演绎逻辑6. 内容页布局:上方12%空间为标题栏,标题24px,左对齐,标题下方有一条暗板岩蓝色横向贯穿分割线(2px),正文部分字体在14到18px之间。标题字体加粗,黑色。 7. 采用中文字体(思源黑体/微软雅黑)8. 我如果知识库中有相应的构图,你可以在输出ppt的时候参考我原来的构图方式。

好了,接着问题来了。

在Notebooklm里面,我们还可以让AI基于我们知识库的内容帮我们生成一个单人或双人口播的音频,或者让AI帮我们生成一个配合PPT讲解的视频。但是这里就有问题了。

如果是音频,你会发现双人讲解的音频内容可能和你前面输出的PPT的内容并没有一一对应,不论是内容还是讲解顺序上。如果直接输出视频,但是视频里面的PPT页面并不是你但是输出的PPT里面的页面。也就是Notebooklm上面的几种演绎形式上面并没有做到很好的同步。

那么我如何处理这个问题?在这个给出一个参考方法。

首先我们还是会让AI帮我输出一个完整的PPT,让后将该PPT导出为PDF文件后,重新将该PDF文件上传到AI笔记库。然后让AI完全基于这个pdf文件,包括页面顺序来帮我输出一个完整的口播音频。最后将口播的音频和PPT内容都导出到本地,在类似剪映等工具里面自己进一步进行合成。大家可以参考下我视频号最近发布的一个关于认知的视频即采用这种方式来完成。如果有更好的做法大家也可以留言评论。

注意,当前的AI笔记是可以直接添加视频超链接地址的。类似我可以直接将我B站视频连接地址添加进来。

但是在这里发现一个问题,AI在解读视频的时候并没有只解读这一个视频,而是将该链接下的其他视频内容也进行了解读。这个后续我会进一步验证,看看有无更好的解决方法。

3.Google Antigravity AI编程工具
最后再将下Antigravity的AI编程工具。这个大家使用的时候要注意打开Tun模式,否则无法正常登录。这个IDE工具集成了最新的Gemini3pro模型,也集成了Claude4.5 Sonnet和Opus模型,简直就是超值。而且耗用量感觉5个小时就会刷新一次,如果使用频度不高的话基本都够用。

那么我用这个最多的就是AI基于我历史知识库文章的辅助写作。

同时我将个人写作方式定义为不同的技能库。其中有直接使用我历史文章图片进行配图的,有采用SVG绘图方式进行配图的,还有直接基于我文章内容调用Nano Banana进行配图的。

大家可以参考下如下提示语说明:

但是直接调用generate_image工具进行配图有相应的用量限制。大家可以看下如下AI-IDE通过调用上面绘图工具生成的配图效果。

再注意,实际上面的各个Skills技能库,是在我最早的一个profile写作提示语的基础上,AI自动帮我生成的。也就是我只需要说清楚我的原始需求,那么让AI自动生成完整的Skills库。当然生成的Skills也可以让AI自动帮我完成安装,在安装完成后我们使用斜杠符号即可能调出相应的技能。

如果我们启用了Plan模式,那么AI在编写任何一篇文章的时候,实际会有详细的Plan和实施计划,类似如下:

可以看到会细化到究竟分几个小标题,每个小标题里面的内容结构,内容来源于我历史哪些文章,如何进行配图等都会详细规划。

在IDE的插件市场里面搜索AGQ我们就可以安装一个用量插件。

安装完成了这个插件后,通过点击右下角的小图标我们就可以实时的看到各个大模型的用量情况,类似如下:

以上即最近个人关于Gemini3 pro使用的一些心得总结。再次强调下,当你原来有大量的历史积累和输出的时候,采用Gemini可以极大的提示你的生产力,特别是NotebookLM AI笔记的使用,可以让你历史已有内容的输出得到更好的形象化演绎。

今天分享就到这里,希望对大家有所启发。

注:最近有不少朋友询问如何加入我建的微信技术沟通群,再次说明,对于公众号的朋友,任意一篇完整打赏36元后,给我私信,我会邀请你进微信技术沟通群,私信不是随时都在看,回复可能稍微有延迟。



53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询