2026年6月18日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

GLM-5.2 技术解读:智谱百万上下文的新一代旗舰模型

发布日期:2026-06-17 19:40:10 浏览次数: 1530
作者:始智AI wisemodel

微信搜一搜,关注“始智AI wisemodel”

推荐语

智谱AI最新旗舰模型GLM-5.2,在百万级超长上下文上实现了稳定可靠的工程表现,为长程任务提供了强大的开源基础。

核心内容:
1. GLM-5.2的四大核心能力升级与开源优势
2. 在长程任务基准测试中作为开源模型第一名的表现
3. 灵活推理投入度与标准编程基准测试的显著提升

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

始智AI wisemodel将打造一个“All for Agent”的原生技术平台,始终坚持“中立、开放、共建、共创、合作”五项基本原则,欢迎加入共同成长。


GLM-5.2初体验来了:像Claude,但还没那么听话

GLM-5.2 是智谱AI(Zhipu AI)推出的最新旗舰大模型,专为长程任务(long-horizon tasks)设计。相较于上一代 GLM-5.1,GLM-5.2 在长程任务能力上有显著提升,并首次在 100万 token(1M context) 的超长上下文上实现了稳定可靠的表现。

img_v3_0212n_dd3e6c79-bb10-4959-9080-56eb8525b92g

四大核心能力升级:

能力
说明
🟢 稳定百万上下文
真正可用的 1M token 上下文,稳定支撑长程工程任务
🟢 灵活编码能力
多档"推理投入度"(effort level),按需平衡性能与延迟
🟢 架构级优化
提出 IndexShare + MTP 改进,推理性价比更高
🟢 完全开源
MIT 协议,无区域限制,开放获取无壁垒

img_v3_0212o_51684a16-c33f-4429-aea5-9f5f7cdfc30g

1. 稳定的百万级上下文

长上下文的真正挑战不在于"能接受多少 token",而在于在超长、混乱的 Agent 轨迹中保持质量稳定。1M context 容易声称,但真正在工程压力下稳定可靠才是难题。

为此,GLM-5.2 大幅扩展了面向 Agent 场景的百万 token 训练数据,覆盖:

  • 大规模代码实现
  • 自动化研究
  • 性能优化
  • 复杂调试

img_v3_0212n_f94802c4-f734-4deb-860f-1f6402907bag

使得模型不仅"窗口宽",而且"执行稳",成为可持续工程工作的实用基础。

三项长程任务基准测试表现:

基准测试
GLM-5.2 表现
排名
FrontierSWE
(数小时规模的开放技术项目:系统优化、大规模代码构建、应用ML研究)
距 Opus 4.8 仅差 1%,领先 GPT-5.5 约 1%,领先 Opus 4.7 约 11%
开源第一
PostTrainBench
(给 Agent H100 GPU,通过后训练提升小模型能力)
超越 Opus 4.7 和 GPT-5.5,仅次于 Opus 4.8
排名第二
SWE-Marathon
(超长程软件工程:构建编译器、优化内核、开发生产级服务)
距 Opus 4.8 差 13%,但稳居开源第一,仅次于 Opus 系列
开源第一

在三项长程基准测试中,GLM-5.2 均为开源模型第一名,验证了其 1M 上下文已转化为真正的长程任务交付能力。


2. 标准编程基准测试

基准测试
GLM-5.2
GLM-5.1
Claude Opus 4.8
Gemini 3.1 Pro
Terminal-Bench 2.1
81.0
63.5
85.0
-
SWE-bench Pro
62.1
58.4
-
-
  • GLM-5.2 在标准编程基准上为最强开源模型,相比 GLM-5.1 大幅提升
  • Terminal-Bench 2.1 仅落后 Claude Opus 4.8 数个百分点,超越 Gemini 3.1 Pro
img_v3_0212n_3ea7ea95-4c53-4192-b613-00eccaa27b9g

3. 灵活推理投入度(Effort Level)控制

GLM-5.2 引入多档推理投入度控制,让用户可以在模型能力与任务执行速度/计算成本之间自由选择:

  • 在相同 token 消耗下,GLM-5.2 的 Agent 编程性能远强于 GLM-5.1,能力定位约在 Claude Opus 4.7 与 Opus 4.8 之间
  • Max 档位:在极具挑战的任务上,可分配更多计算资源,进一步提升编程能力
  • 设计哲学:给予用户更大灵活性,让不同场景都能找到最适合的推理模式

4. 百万上下文架构:IndexShare

4.1 为什么需要 IndexShare?

在 1M 上下文长度下,DSA(动态稀疏注意力)的 indexer 计算成本显著增加。为了解决这个问题,GLM-5.2 应用了 IndexShare 技术:

核心做法: 每 4 个 Transformer 层共享一个轻量级 indexer。

- 该 indexer 放置在 4 层中的第一层

- 其 top-K 索引在后续 3 层中被复用

- 3/4 层的 indexer 点积和 top-K 操作被完全省去

image

效果: 在 1M 上下文长度下,每个 token 的 FLOPs 降低 2.9 倍。GLM-5.2 从 128K 序列长度开始基于 IndexShare 训练,在更少计算量下超越了 GLM-5.1 的长上下文表现。

4.2 MTP 层与 KV 优化

GLM-5.2 对 MTP(Multi-Token Prediction)层做了两项改进,以服务于投机解码(speculative decoding):

目标一: 最小化 MTP 作为 Draft 模型的开销 → 同样应用 IndexShare

目标二: 最大化投机解码接受率 → 消除 GLM-5.1 MTP 层中的训练-推理不一致性

以两步 MTP 推理为例:

  • 第一步:与训练一致,所有隐状态来自目标模型
  • 第二步:h₁:₄ 来自目标模型,h₅ 来自 MTP 层 → KV 缓存是混合状态,造成不一致

IndexShare 解决了这个问题:通过在 MTP 各步复用 top-K 索引,保持推理时 KV 缓存的一致性,MTP 接受长度提升最高达 20%

CleanShot 2026-06-16 at 21.16.26@2x


5. 完全开源

GLM-5.2 采用 MIT 开源协议

  • ✅ 无区域限制
  • ✅ 技术获取无国界壁垒
  • ✅ 可自由商用、修改和分发

总结

GLM-5.2 是智谱在长程 Agent 能力上的一次重大突破:

  • 百万上下文
    真正从"能接受"变成"用得住",大幅扩展了编程 Agent 的任务边界
  • IndexShare 架构
    将 1M 上下文的计算成本降低近 3 倍,实用性大幅提升
  • 多档 Effort Level
    让用户按需平衡性能与成本,适配从快速验证到深度研究的多样场景
  • MIT 开源
    让全球开发者无障碍获取和使用

GLM-5.2 目前是开源编程模型的新标杆,在长程任务上与闭源顶级模型(Opus 4.8、GPT-5.5)的差距已大幅缩小。

-----    END   -----

往期推荐

wisemodel相关:

1、始智AI-wisemodel社区正式上线,目标打造中国版“HuggingFace”

2、招募 | 新一期开源共创志愿者计划,欢迎加入共同成长

3、欢迎加入 | 落地落地!百位行业专家计划正式启动!

4、算力服务 |降价降价!4090算力全面降价!包月只要1.5元/卡时

系列模型:

『书生』科学大模型Intern-S2-Preview开源!

告别“拼接”,原生多模态SenseNova-U1统一理解与生成

GLM-5.1全面进化,紧逼Opus 4.6

Skill Sonar如何给OpenClaw加上安全护栏

LiveClin:239位医生打造“实时+临床全路径”的医疗评测基准

RWKV-7 G1e模型发布,能力全面增强

关注openclaw安全风险,AgentDoG提出智能体安全与防护的诊断式护栏框架

Seedance3.0技术曝光!Helios首个单卡实时生成长视频模型开源

万亿参数Yuan3.0 Ultra开源,企业Agent AI核心能力领先

  • Wisemodel Agentverse

OpenClaw如何接入始智AI Agent世界

AgentVerse智能体社区崛起!首周运营全景报告

始智AI-Agentverse上线!让你的Agent 加入一个真正的数字社会

研究洞察 | “All for Agent”理念下,未来数字世界的蓝图

研究洞察 | “All for Agent”——数字世界新趋势新范式

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询