微信扫码
添加专属顾问
我要投稿
Google 最新发布的 Gemini 3.1 Pro 在推理能力上实现惊人飞跃,代码与科学推理双领域表现封神! 核心内容: 1. 推理能力大幅提升,ARC-AGI-2 基准从 31% 飙升至 77% 2. 多场景应用展示,包括航天仪表盘、3D 交互仿真和文学作品转网站 3. 定价与上线渠道公布,覆盖开发者、企业和普通用户
今天凌晨,Google 发布 Gemini 3.1 Pro!
根据官方博客信息显示,核心提升在推理能力
ARC-AGI-2(抽象推理基准)从 3 Pro 的 31.1% 跳到 77.1%
GPQA Diamond(科学知识推理)从 91.9% 提到 94.3%
Terminal-Bench 2.0(终端编程)从 56.9% 提到 68.5%
SWE-Bench Verified(代码修复)从 76.2% 提到 80.6%
目前处于 Preview 阶段,已在 Gemini API(AI Studio)、Gemini CLI、Antigravity、Vertex AI、Gemini App 和 NotebookLM 推送
SVG 动画。相比于 Gemini 3 Pro ,Gemini 3.1 Pro 的 SVG 效果更加细腻
实时数据仪表盘。使用 Gemini 3.1 Pro 构建一个航天仪表盘,接入国际空间站的遥控数据,实时可视化轨道信息。从 API 对接到页面渲染一气呵成。
3D 交互仿真。使用 Gemini 3.1 Pro 通过 3D hoid 算法,支持手部操控的交互式鸟群飞行模拟系统。
文学作品转网站。根据《呼啸山庄》做一个现代个人网站。模型非常好地理解了小说的内容,网站质量非常高。
现任 Google 的首席科学家 Jeff Dean(Jeffrey Adgate Dean)也秀出了几个 Case。
SVG 动画。
城市规划模拟。用 Gemini 3.1 Pro进行城市规划仿真,用来设计一座全新的城市。
热传导分析。利用 Gemini 3.1 Pro Deep Think 做热传导分析,全程不调用外部工具,只用模型本身的推理和图像生成能力。
Step 1 从技术图纸生成 CAD 模型,Step 2 基于 CAD 和材料参数做热传导分析,Step 3 把不同加热时间点的温度场结果渲染成可视化图像。
标准 context(200K 以内):
输入 $2,输出 $12
超长 context(200K 以上):
输入 $4,输出 $18
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-03-21
编程选GPT-5.4,还是GPT-5.3-Codex?
2026-03-21
AI Coding前端实践后的复盘总结
2026-03-21
OpenAI 首席科学家:Codex 只是雏形,我们要造的是「全自动 AI 研究员」
2026-03-21
谷歌Stitch「氛围设计」干崩Figma 8.8%股价:十年经验,败给巨头一次更新(附实测)
2026-03-21
为什么 CLI 比 MCP 更适合 LLM
2026-03-21
渐进式披露(Progressive Disclosure):Agent 从 Demo 到企业级落地的 “救命架构”
2026-03-21
AI 编程工具怎么选?Codex 和 Claude Code 的本质区别
2026-03-21
Karpathy 最新播客:我得了 AI 精神病、App 将消失、Agent 将碾压实验室
2026-01-24
2026-01-10
2026-01-01
2026-01-26
2026-01-09
2026-01-09
2026-01-23
2025-12-30
2026-01-14
2026-01-21
2026-03-21
2026-03-20
2026-03-19
2026-03-19
2026-03-19
2026-03-18
2026-03-17
2026-03-17