微信扫码
添加专属顾问
我要投稿
智谱AI最新旗舰模型GLM-5.2,在百万级超长上下文上实现了稳定可靠的工程表现,为长程任务提供了强大的开源基础。核心内容:1. GLM-5.2的四大核心能力升级与开源优势2. 在长程任务基准测试中作为开源模型第一名的表现3. 灵活推理投入度与标准编程基准测试的显著提升
始智AI wisemodel将打造一个“All for Agent”的原生技术平台,始终坚持“中立、开放、共建、共创、合作”五项基本原则,欢迎加入共同成长。
四大核心能力升级:
长上下文的真正挑战不在于"能接受多少 token",而在于在超长、混乱的 Agent 轨迹中保持质量稳定。1M context 容易声称,但真正在工程压力下稳定可靠才是难题。
为此,GLM-5.2 大幅扩展了面向 Agent 场景的百万 token 训练数据,覆盖:
使得模型不仅"窗口宽",而且"执行稳",成为可持续工程工作的实用基础。
三项长程任务基准测试表现:
| FrontierSWE | ||
| PostTrainBench | ||
| SWE-Marathon |
在三项长程基准测试中,GLM-5.2 均为开源模型第一名,验证了其 1M 上下文已转化为真正的长程任务交付能力。
| 81.0 | ||||
| 62.1 |
GLM-5.2 引入多档推理投入度控制,让用户可以在模型能力与任务执行速度/计算成本之间自由选择:
在 1M 上下文长度下,DSA(动态稀疏注意力)的 indexer 计算成本显著增加。为了解决这个问题,GLM-5.2 应用了 IndexShare 技术:
核心做法: 每 4 个 Transformer 层共享一个轻量级 indexer。
- 该 indexer 放置在 4 层中的第一层
- 其 top-K 索引在后续 3 层中被复用
- 3/4 层的 indexer 点积和 top-K 操作被完全省去
效果: 在 1M 上下文长度下,每个 token 的 FLOPs 降低 2.9 倍。GLM-5.2 从 128K 序列长度开始基于 IndexShare 训练,在更少计算量下超越了 GLM-5.1 的长上下文表现。
GLM-5.2 对 MTP(Multi-Token Prediction)层做了两项改进,以服务于投机解码(speculative decoding):
目标一: 最小化 MTP 作为 Draft 模型的开销 → 同样应用 IndexShare
目标二: 最大化投机解码接受率 → 消除 GLM-5.1 MTP 层中的训练-推理不一致性
以两步 MTP 推理为例:
h₁:₄ 来自目标模型,h₅ 来自 MTP 层 → KV 缓存是混合状态,造成不一致IndexShare 解决了这个问题:通过在 MTP 各步复用 top-K 索引,保持推理时 KV 缓存的一致性,MTP 接受长度提升最高达 20%。
GLM-5.2 采用 MIT 开源协议:
GLM-5.2 是智谱在长程 Agent 能力上的一次重大突破:
GLM-5.2 目前是开源编程模型的新标杆,在长程任务上与闭源顶级模型(Opus 4.8、GPT-5.5)的差距已大幅缩小。
往期推荐
wisemodel相关:
系列模型:
告别“拼接”,原生多模态SenseNova-U1统一理解与生成
LiveClin:239位医生打造“实时+临床全路径”的医疗评测基准
关注openclaw安全风险,AgentDoG提出智能体安全与防护的诊断式护栏框架
Seedance3.0技术曝光!Helios首个单卡实时生成长视频模型开源
万亿参数Yuan3.0 Ultra开源,企业Agent AI核心能力领先
Wisemodel Agentverse
始智AI-Agentverse上线!让你的Agent 加入一个真正的数字社会
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-16
26.1%的AI编程技能有漏洞:NVIDIA开源 SkillSpector 能扫出什么?
2026-06-12
当 AI Coding Agent 成为基础设施:我们为什么要开源 LoongSuite Pilot
2026-06-09
CPU 跑得比 Whisper GPU还快的开源语音识别,本地部署
2026-06-09
别再问我什么是爱马仕!
2026-06-09
Open Design:开源界的 Claude Design 替代品,61.7K Star,21+ Agent 都能跑,本地第一
2026-06-08
我开源了 PPT-Library:让历史 PPT 变成 AI 可复用资产
2026-06-08
knowledge-work-plugins:Anthropic 官方开源的知识工作插件集,19,000+Star
2026-06-08
从搜索、点击、表单填写到复杂网页操作,让 AI 像人一样使用浏览器
2026-03-30
2026-04-09
2026-04-03
2026-03-23
2026-04-01
2026-03-31
2026-03-30
2026-04-18
2026-04-18
2026-03-20
2026-06-16
2026-05-30
2026-05-16
2026-04-22
2026-04-21
2026-04-15
2026-04-09
2026-04-01