我要投稿

Google 凌晨炸场！Gemini 3.1 Pro 发布：推理能力从 31% 飙升至 77%，代码与科学推理双封神！

发布日期：2026-02-20 08:19:36 浏览次数： 2263

作者：悟鸣AI

微信搜一搜，关注“悟鸣AI”

今天凌晨，Google 发布 Gemini 3.1 Pro！

根据官方博客信息显示，核心提升在推理能力

ARC-AGI-2（抽象推理基准）从 3 Pro 的 31.1% 跳到 77.1%
GPQA Diamond（科学知识推理）从 91.9% 提到 94.3%
Terminal-Bench 2.0（终端编程）从 56.9% 提到 68.5%
SWE-Bench Verified（代码修复）从 76.2% 提到 80.6%

目前处于 Preview 阶段，已在 Gemini API（AI Studio）、Gemini CLI、Antigravity、Vertex AI、Gemini App 和 NotebookLM 推送

Google 发布页面 Demo

SVG 动画。相比于 Gemini 3 Pro ，Gemini 3.1 Pro 的 SVG 效果更加细腻

实时数据仪表盘。使用 Gemini 3.1 Pro 构建一个航天仪表盘，接入国际空间站的遥控数据，实时可视化轨道信息。从 API 对接到页面渲染一气呵成。

3D 交互仿真。使用 Gemini 3.1 Pro 通过 3D hoid 算法，支持手部操控的交互式鸟群飞行模拟系统。

文学作品转网站。根据《呼啸山庄》做一个现代个人网站。模型非常好地理解了小说的内容，网站质量非常高。

网友的 Demo

现任 Google 的首席科学家 Jeff Dean（Jeffrey Adgate Dean）也秀出了几个 Case。

SVG 动画。

城市规划模拟。用 Gemini 3.1 Pro进行城市规划仿真，用来设计一座全新的城市。

热传导分析。利用 Gemini 3.1 Pro Deep Think 做热传导分析，全程不调用外部工具，只用模型本身的推理和图像生成能力。

Step 1 从技术图纸生成 CAD 模型，Step 2 基于 CAD 和材料参数做热传导分析，Step 3 把不同加热时间点的温度场结果渲染成可视化图像。

定价

标准 context（200K 以内）：
输入 $2，输出 $12

超长 context（200K 以上）：
输入 $4，输出 $18

上线渠道与使用方式

面向开发者：已在 Gemini API（Google AI Studio、Gemini CLI、Google Antigravity、Android Studio）中以预览形式提供，可用于构建智能 Agent、应用等。
面向企业：可在 Vertex AI 与 Gemini Enterprise 中访问，用于企业级应用和工作流。
面向普通用户：通过 Gemini App 和 NotebookLM 提供，其中 3.1 Pro 在这两处目前仅向 Google AI Pro 和 Ultra 订阅用户开放，并提供更高使用配额

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-23

暴论：Agent Skill 会被淘汰

2026-06-23

ClaudeCode团队负责人最新访谈：AI原生团队，到底如何运转？（5条底层逻辑）

2026-06-22

为什么我选 WorkBuddy 而不是 Codex

2026-06-22

没想到，DeepSeek建模潜力被ORGEval挖出来了

2026-06-22

当 AI 开始承担任务：从工具、产品到组织的 AI-native 方法论

2026-06-21

从提示 Agent 到循环工程

2026-06-21

微信小微，几个要点

2026-06-21

AI 也会做梦？拆解 OpenClaw 独特的梦境记忆系统

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

OpenAI Codex CLI 完整使用指南

2026-04-07

Claude Code 和 Codex 接入 Figma MCP 保姆级教程

2026-04-07

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

GPT5.5来了，最大特点解析

2026-04-24

Claude Opus 4.7 发布，全网最详细解读

2026-04-17

突发！Claude Code 源码泄露，扒出这些隐藏功能

2026-03-31

GPT-6，曝光了

2026-04-05

GLM-5.1 实测：面向 Agent 长程任务的国内第一模型

2026-04-02

重磅！GPT-6曝光了

2026-04-05

大家都在问

企业智能体的下半场，如何让智能体越用越聪明？

2026-06-18

Agent 记忆，我们全都理解错了？

2026-06-18

如何利用 Harness “一句话交付产品功能”？

2026-06-10

Loop Engineering 循环工程又是什么鬼？

2026-06-10

Agent 工程化五件套：Prompt、Skill、MCP、CLI 到底怎么配合？

2026-06-07

为什么云端 Agent 基建这么难？

2026-06-06

当 AI 开始拥有“自主调度权”：Claude 4.8 这个新功能，到底有多可怕？

2026-06-03

哪些活，该交给Claude Code的 /workflows?

2026-06-02

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部