我要投稿

谷歌发布Gemini 3 Flash，口述即原型，速度堪比搜索引擎

发布日期：2025-12-18 11:18:28 浏览次数： 2014

作者：DeepTech深科技

微信搜一搜，关注“DeepTech深科技”

谷歌和 OpenAI 彻底杀疯了，在 OpenAI 发布图像模型的一天后，当地时间 12 月 17 日谷歌正式发布 Gemini 3 Flash，其宣传语是“以极低的成本，实现速度极快的尖端智能”。

3 Flash 让极速智能进入了主力机时代，实现了 3 倍提速和成本骤降，零代码也能造应用，开启了氛围编程，实现了口述即原型。谷歌官方称其速度堪比搜索引擎，它在保持 Pro 级智商的同时，将 tokens 消耗降低了 30%，旨在重塑大模型性价比天花板。

（来源：资料图）

在此时发布这样一个快速且价格低廉的 3 Flash，或许意图抢占 OpenAI 的图像模型的风头。而在基准测试中，3 Flash 大幅超越了其前代产品，并在某些方面与 Gemini 3 Pro 和 GPT 5.2 等其他前沿模型不相上下。

谷歌表示，3 Flash 拥有前沿智能，专为速度而生，可以帮助用户更快地学习、构建和规划任何事物。它可以很好地识别多模态内容，并据此给出答案。

例如，可以上传一段匹克球短视频并寻求技巧指导；也可以尝试绘制一幅素描画，让模型猜猜你画的是什么；或者可以上传一段录音以便获得分析结果或者生成测验。该模型可以更好地理解用户查询的意图，并能生成包含图像和表格等元素在内的更具视觉冲击力的答案。

其氛围编程能力具体指的是，无需任何编程知识，就能用语音快速构建应用程序。只需对着 Gemini 进行口述，就能在几分钟内将零散想法转化为一个功能齐全的应用程序。

即使你没有任何编程基础，也能快速从零开始构建应用程序，只需让 Gemini 帮助迭代你的想法即可。用户可以随时随地口述自己的灵感，并将其转化为原型。

3 Flash 的 AI 模式能够更有效地解析问题的细微差别。它会考虑用户问题的每一个方面，并提供更全面、更易于理解的答案，比如它会从全网提取实时本地信息和实用链接。最终，它能让用户获得一份条理清晰的分析报告和具体建议。

3 Flash 保留了 Gemini 3 的复杂推理、多模态/视觉理解以及在智能体/氛围编程任务中的出色性能。3 Flash 在各方面都超越了 2.5 Flash，并且在多项基准测试中显著优于 2.5 Pro。3 Flash 也与 3 Pro 性能相当，在 MMMU Pro、Toolathlon 和 MPC Atlas 等方面更胜一筹。

（来源：资料图）

在 GPQA 钻石级（科学知识）上其准确率达到 90.4%，在人类最后的考试（学术推理）上其在不使用工具时的得分为 33.7%，在 MMMU Pro（多模态理解和多模态推理上）其达到 81.2% 的正确率，在 SWE-Bench 验证（代码理解）上其达到 78% 的正确率，在工具竞赛（长期真实世界软件任务）上其达到 49.4% 的正确率，在 MCP Atlas（使用 MCP 的多步骤工作流程）上其达到 57.4% 的准确率。