免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

谷歌发布Gemini 3 Flash,口述即原型,速度堪比搜索引擎

发布日期:2025-12-18 11:18:28 浏览次数: 1535
作者:DeepTech深科技

微信搜一搜,关注“DeepTech深科技”

推荐语

谷歌Gemini 3 Flash震撼发布,零代码口述即可生成应用原型,速度堪比搜索引擎,重新定义AI开发效率!

核心内容:
1. 3 Flash突破性性能:3倍提速、30%成本降低,保持Pro级智商
2. 革命性功能:氛围编程实现语音快速构建应用,多模态内容精准识别
3. 基准测试表现:多项指标超越前代产品,与顶级模型不相上下

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


谷歌和 OpenAI 彻底杀疯了,在 OpenAI 发布图像模型的一天后,当地时间 12 月 17 日谷歌正式发布 Gemini 3 Flash,其宣传语是“以极低的成本,实现速度极快的尖端智能


3 Flash 让极速智能进入了主力机时代,实现了 3 倍提速和成本骤降,零代码也能造应用,开启了氛围编程,实现了口述即原型。谷歌官方称其速度堪比搜索引擎,它在保持 Pro 级智商的同时,将 tokens 消耗降低了 30%,旨在重塑大模型性价比天花板。


(来源:资料图)


在此时发布这样一个快速且价格低廉的 3 Flash,或许意图抢占 OpenAI 的图像模型的风头。而在基准测试中,3 Flash 大幅超越了其前代产品,并在某些方面与 Gemini 3 Pro 和 GPT 5.2 等其他前沿模型不相上下。


谷歌表示,3 Flash 拥有前沿智能,专为速度而生,可以帮助用户更快地学习、构建和规划任何事物。它可以很好地识别多模态内容,并据此给出答案。


例如,可以上传一段匹克球短视频并寻求技巧指导;也可以尝试绘制一幅素描画,让模型猜猜你画的是什么;或者可以上传一段录音以便获得分析结果或者生成测验。该模型可以更好地理解用户查询的意图,并能生成包含图像和表格等元素在内的更具视觉冲击力的答案。


其氛围编程能力具体指的是,无需任何编程知识,就能用语音快速构建应用程序。只需对着 Gemini 进行口述,就能在几分钟内将零散想法转化为一个功能齐全的应用程序。


即使你没有任何编程基础,也能快速从零开始构建应用程序,只需让 Gemini 帮助迭代你的想法即可。用户可以随时随地口述自己的灵感,并将其转化为原型。


3 Flash 的 AI 模式能够更有效地解析问题的细微差别。它会考虑用户问题的每一个方面,并提供更全面、更易于理解的答案,比如它会从全网提取实时本地信息和实用链接。最终,它能让用户获得一份条理清晰的分析报告和具体建议。


3 Flash 保留了 Gemini 3 的复杂推理、多模态/视觉理解以及在智能体/氛围编程任务中的出色性能。3 Flash 在各方面都超越了 2.5 Flash,并且在多项基准测试中显著优于 2.5 Pro。3 Flash 也与 3 Pro 性能相当,在 MMMU Pro、Toolathlon 和 MPC Atlas 等方面更胜一筹。


(来源:资料图)


在 GPQA 钻石级(科学知识)上其准确率达到 90.4%,在人类最后的考试(学术推理)上其在不使用工具时的得分为 33.7%,在 MMMU Pro(多模态理解和多模态推理上)其达到 81.2% 的正确率,在 SWE-Bench 验证(代码理解)上其达到 78% 的正确率,在工具竞赛(长期真实世界软件任务)上其达到 49.4% 的正确率,在 MCP Atlas(使用 MCP 的多步骤工作流程)上其达到 57.4% 的准确率。


(来源:资料图)


谷歌宣称,Flash 3 的性能比 2.5 Pro 快 3 倍,成本却低得多。并表示这种强大的产品逻辑、工具使用和多模态功能,可以为构建客户支持代理或游戏内助手的第三方开发者带来更复杂的视频分析、数据提取和视觉问答功能。


其定价为每百万个输入 tokens 0.5 美元,每百万个输出 tokens 3 美元,音频输入仍为每百万个输入 tokens 1 美元。


但是谷歌声称,新模型的性能优于 Gemini 2.5 Pro,速度也是后者的三倍。而且,在处理思维任务的时候,它平均比 2.5 Pro 少用 30% 的 tokens。这意味着,在某些任务中有望带来 tokens 的节约。


Gemini 大模型高级总监兼产品负责人图尔西·多希(Tulsee Doshi)告诉媒体:“我们真正地将 Flash 定位为更加偏向主力机型的模型。如果看一下输入价格和输出价格,就会发现 Flash 要便宜得多。因此,它可以帮助许多公司完成批量性的任务。


3 Flash 现在已经在 Gemini 应用中推出,并将取代 2.5 Flash 成为默认模型。值得注意的是,3 Flash 将在型号选择中提供两种选项:第一种是快速选项用于快速解答问题;第二种是思考选项用于解决复杂问题。它也允许用户提出更细致的问题。



谷歌指出,JetBrains、Figma、Cursor、Harvey 和 Latitude 等公司已经在使用 3 Flash 模型,该模型可以通过 Vertex AI 和 Gemini Enterprise 获取。


与此同时,谷歌正在向所有美国用户开放配备生成式用户界面以及搭载了 Nano Banana Pro 的 Gemini 3 Pro。对于开发者而言,3 Flash 预览版现已可通过 AI Studio、Google Antigravity、Gemini CLI 和 Android Studio 获取。


事实上,自从发布 Gemini 3 以来,谷歌每天在其 API 上处理超过一万亿个 tokens,同时与 OpenAI 展开了激烈的发布进度竞争和性能竞争。


本月初,由于谷歌在消费者市场上份额的上升,ChatGPT 的流量开始出现下滑,OpenAI CEO 山姆·奥特曼(Sam Altman)为此向 OpenAI 内部发了一份内部红色警报备忘录。


此后不久,OpenAI 发布了 GPT 5.2 和一个新的图像生成模型。OpenAI 还宣称其企业应用日益增长,并表示自 2024 年 11 月以来,ChatGPT 的消息量增长了 8 倍。虽然谷歌没有直接回应与 OpenAI 的竞争,但其表示此次新模型的发布将促使所有公司进行积极参与。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询