微信扫码
添加专属顾问
我要投稿
a16z实测AI办公工具,帮你找到最适合的工作伙伴,提升效率不再纠结选择困难。 核心内容: 1. AI办公工具市场现状与分类:通才与专才工具对比 2. 实测结果:不同场景下表现优异的工具推荐 3. 未来趋势:AI如何深度融入日常工作流程
a16z 的 AI 办公工具测评,他们测了市面上最火的 AI native办公套件——从做 PPT、整理 Excel、写邮件到做会议纪要,统统都测了一下。
整理出的测试结果表格比较一目了然,懒得看全文的可以直接刷到表格图。纯粹算是给大家个参考。分割线后是正文。
btw,本篇和上篇的排版都来自于大聪明在飞书文档的“公众号排版器”插件,拱手感恩(´ᴗ`ʃƪ)。
AI不再仅仅是一个功能——它正成为一个团队成员!从撰写电子邮件到设计幻灯片、研究市场或构建财务模型,一种新Agentic tools正在出现,类似于 AI-native的办公套件。
但这里有一个挑战:截至目前,市场仍然是碎片化的,每周都有新工具出现。Anthropic 本周刚刚为 Claude 推出了“creating and editing file”功能!消费者不禁在想:我到底应该使用哪个工具,以及在什么场景下可以开始将agentic tools嵌入我的日常工作中?
为了了解这些工具在实践中的表现,我们对市场进行了映射,并在各种日常办公任务中对 AI-native工具进行了基准测试——制作电子表格、记录会议笔记和撰写电子邮件。我们的benchmarks发现了一些通用工具的出色表现,一些突出的垂直应用,以及关于市场发展的一些线索。
市场正在分化为两种agentic productivity。一方面是“全能型”通用工具,旨在处理跨应用和任务的任何内容。另一方面是垂直专家,旨在深入单一工作流程,如电子邮件、幻灯片或电子表格。两者都在快速发展——而且都有权衡。
Generalists – Horizontal tools
通才工具旨在提供灵活性。它们可以在不同的上下文、应用和任务之间移动,但往往以顺滑度和精确度为代价。在这一阵营中,有三种格式脱颖而出:
Specialists – Vertical Tools
专业工具旨在提供深度和可靠性。这些工具专注于结构化工作流程,而不是试图做所有事情,在这些工作流程中,信任、精致和user control至关重要。今天的垂直领域由涵盖核心专业工作流程的工具支撑。
为了查看这些工具在实际任务中的表现,我们对它们进行了基准测试,以衡量它们的成功之处和不足之处。
这些prompts涵盖六个核心维度:总结、沟通、文件理解、研究、规划和执行。
Use Case 1: PowerPoint
Prompt:Design a visual-heavy, 7-slide deck about Gen Z internet behavior trends in 2025.
Gamma 作为一个垂直化的 AI 工具,内置模板和设计功能,使得演示文稿可以在两分钟内生成。作为一个完整的演示编辑器,它提供了广泛的编辑控制选项 – 用户可以调整布局、改变视觉效果和字体、添加图表,并提示 AI 提供文本或设计建议。
Genspark 和 Manus 作为通用助手,倾向于生成内容更丰富的演示文稿,通常更接近研究报告。它们的输出生成时间较长,但往往表现出更深入的分析和更强的提示对齐。ChatGPT Agent 生成的演示文稿则更简单,类似于基于文本的报告,设计能力较弱且生成时间更长。
Anthropic 本周刚刚在 Claude 中推出了文件创建和编辑功能。在演示文稿生成任务中,它是我们测试过的最快的通用Agent,尽管设计仍需改进。
总体而言,如果您需要用于外部的演示文稿,视觉质量和生成后控制至关重要,那么 Gamma 是最佳选择。如果您正在寻找一个内容丰富的演示文稿以激发研究或分析,那么 Genspark 是更好的选择。
Use Case 2: Spreadsheet
Prompt:Extract all the data from this PDF and calculate operating margin.
提示:从此 PDF 中提取所有数据并计算营业利润率。
电子表格是一个复杂的用例。它们的复杂性在复杂的财务模型等输出中尤为明显,在这些情况下,格式和准确性都至关重要。不过,AI 电子表格工具开始在更基本和中级的任务中显现出效果,例如从 PDF 中提取数据和进行基本的财务计算。
在这个测试中,我们上传了一份 S-1 文件的页面,并要求工具计算公司的营业利润率。在通用Agent中,Manus 表现最佳:它将数据提取到结构化的电子表格格式中,并迅速返回准确的结果。Claude 在电子表格任务中也是最快的,并给出了正确的答案,但它的输出有限——提供的分析很少,并未将完整的数据集提取到表格中。
Shortcut 作为一个专注于 Excel 的垂直代理,在原生 Excel 环境中提供了更全面的分析,尽管运行时间较长,并且仅提取与计算相关的数据,而不是完整的数据集。
Use Case 3: Email
Prompt:email to schedule a dinner on next Thursday
Fyxer、Serif 和 Jace 作为电子邮件的垂直助手。每个助手都能生成合格的草稿,并在邮件线程中保持上下文。Serif 在定制化方面表现突出:它支持操作手册、电子邮件标签和偏好设置,为用户提供了一种编码最佳实践并在类似场景中应用一致工作流程的方法。
他们的调度方法各不相同,但都能够执行一个简单的调度任务:
相比之下,Comet 将通用助手功能引入电子邮件。它可以起草回复,按照提示安排会议,发送邀请,并搜索收件箱。但它缺乏内置的自定义功能,如操作手册、标签或偏好设置,因此与专用电子邮件助手相比,草稿感觉不够个性化。
Use Case 4: Research
Prompt:Summarize and compare the latest quarterly cloud revenue growth for Microsoft, Amazon, and Google in a table with sources, then analyze the drivers behind the results in a short report.
得益于 AI 工具,消费者现在可以在几秒钟内生成深入且基于研究的分析——这些工作以前可能需要数小时的努力和多年的经验。
我们测试的所有产品都能够提取正确的云收入增长数据并将其整理成表格。差异体现在细微之处和速度上,反映了每个产品的基础优化和限制。
Comet 和 Dia,这两款 AI 原生浏览器,是最快的。它们在 20 秒内返回结果,但与 Manus 相比,它们的输出分析较少且结构不够严谨,而 Manus 提供了更全面的表格和对数字背后驱动因素的更深入解释。
源质量也有所不同。Comet 和 ChatGPT Agent 因直接引用权威来源如财报和雅虎财经而脱颖而出,通常包括内联引用,使得验证准确性变得更容易。
总体而言,tradeoff是明确的:如果您优先考虑更深入的分析,并且对处理时间不太敏感,Manus 是最强的选择。如果您重视速度并希望快速获得一个不错的答案,Comet 更适合。
Use Case 5: Meeting Note-taking
会议期间记事本处于开启状态
会议记录是最自然的AI应用之一,它通过让用户专注于对话而不是打字来节省消费者的精力。此类工具通常以记事本格式运行,自动转录和结构化讨论,而 ChatGPT 的记录模式则提供了一种更轻量的替代方案。所有被评估的产品都支持通过关键字搜索进行检索,但它们在笔记质量、定制和协作方面的优势各不相同。
Mem 生成最详尽的记录,详细捕捉讨论和行动项,而 ChatGPT 的记录模式提供更高层次的摘要,易于浏览但不够完整。Granola 通过可定制的模板区分开来,这些模板可以适应不同的会议类型,使用户对结构和输出有更多的控制。
Granola、Mem 和 Notion 都允许用户提前准备笔记,在会议期间添加指导,并实时跟踪转录。Notion 在协作方面表现突出:任务可以直接在笔记中分配,同步到 Notion 日历,并与更广泛的团队工作流程对齐。
总体而言,如果您想要全面的capture,Mem 是最佳选择;对于结构和自定义,Granola 表现出色;而在团队协调方面,Notion 是最强的选择。
通过对这些用例进行测试,看到了几个模式:
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-10-29
初创公司的增长之道:如何让AI主动推荐你的产品?(下)
2025-10-29
AI将所有生意都卷成了创意产业
2025-10-28
ubuntu 本地部署MinerU完成文档解析
2025-10-27
AI浏览器的正确使用姿势是什么?我从Dia的这90+个Skills里找到了一些好场景
2025-10-27
魔笔 AI Chat Builder:让 AI 对话秒变可交互界面
2025-10-20
天猫行业中后台前端研发Agent设计
2025-10-20
告别错别字和退格键!这款AI语音输入法,让你的打字效率倍增(含实测体验)
2025-10-19
AI自动生成工作流,n8n官方出品
2025-08-06
2025-09-17
2025-09-04
2025-09-02
2025-09-15
2025-09-05
2025-08-22
2025-09-18
2025-08-20
2025-10-10