我把Claude Code换成GLM-4.7用了6小时，我竟然没发现明显区别

发布日期：2025-12-23 19:34:23 浏览次数： 5654

作者：刘小排r

微信搜一搜，关注“刘小排r”

GLM 4.7发布了，从客观数据看，编程方面进步很大。

智谱可能是国内最早打“平替Claude”牌的AI厂商了，对于智谱的新模型，我也毫不犹豫用Claude Code来测试，看看这次平替能力是否进步了。

先说结论：

我把Claude Code换成 GLM-4.7 用了6小时，竟然没发现明显区别，最明显的区别是省钱了。

省流版

前端能力进步很大，审美极强。
用GLM-4.7驱动Claude Code，中等难度以下任务，几乎感觉不到和原版有区别。高难度任务（如：需要反复压缩上下文跨越多个上下文窗口的情况），能够看出来有区别，相比Claude Code原版更容易健忘。
有点难以置信：在LMARENA的WebDev盲测榜中，GLM-4.7位列全球第六，甚至超过了GPT-5.2。
GLM-4.7是开源的，史上编程能力最强的开源模型！老外一定会深感震撼，按照某些美国明星科技企业的秉性，稍后等他们一起床，就会开始套壳了。
GLM Coding Plan 20人民币/月的套餐值得购买，下文有二维码。
小遗憾：暂时不是多模态（可以通过MCP来补）；上下文长度200K，属于中等长度。

下面我们稍微展开讲讲。

如何在Claude Code里使用GLM 4.7？

这里点赞一下智谱官方的贴心和专业。无论是Claude Code、还是Cline、Droid，所有开发者常用的工具，官方都做了教程。

https://docs.bigmodel.cn/cn/coding-plan/tool/claude-for-ide

我同时在Claude Code IDE插件、 Claude Code CLI、Droid、Cline里设置了GLM 4.7。四个方式我都感受了，我认为是在Claude Code IDE插件/Claude Code CLI里，GLM 4.7的体验最好。

前端能力进步很大

在前两个月，但凡Google/OpenAI/Anthropic发布了新的模型，都会引入一个“金门大桥测试”。

这个测试非常难，以前用国产模型做，效果都不太好。因为这个任务还挺难的，是一个综合性特别强的任务，包括需要有世界知识、需要有物理知识、需要3D细节、可交互镜头、雨天地面湿润反光等等。

GLM-4.7很争气，一次搞定。

不过，可能是因为这个任务太难了，第一次做出来的时候，性能不是特别好。我再额外和GLM-4.7单聊了一会儿优化性能的事。

下面请欣赏， GLM-4.7完成的金门大桥。

怀疑作弊？我没有作弊，你可以复现！我来公布原始Prompt，你使用这一段Prompt，发给GLM-4.7，你也能得到同样的效果！震不震惊？

ObjectiveBuild a visually stunning, high-fidelity 3D voxel-style simulation of the Golden Gate Bridge in Three.js.Prioritize complex visuals (not simple blocks), strong atmosphere depth, and smooth ~60FPS.Visuals & Atmosphere- Lighting: a Time-of-day slider (0–24h) that controls sun position, intensity, sky color, and fog tint.- Fog: volumetric-feeling fog using lightweight sprite particles; slider 0–100 (0 = crystal clear, 100 = dense but not pure whiteout).- Water: custom shader for waves + specular reflections; blend horizon with distance-based fog (exp2) so the far water merges naturally.- Post: ACES filmic tone mapping + optimized bloom (night lights glow but keep performance).Scene Details- Bridge: recognizable art-deco towers, main span cables + suspenders, piers/anchors consistent with suspension bridge structure.- Terrain: simple but convincing Marin Headlands + SF side peninsula silhouettes.- Skyline: procedural/instanced city blocks on the SF side to suggest depth.- Traffic: up to ~400 cars via InstancedMesh, properly aligned on the deck (avoid clipping). Headlights/taillights emissive at night.- Ships: a few procedural cargo ships with navigation lights moving across the bay.- Nature: a small flock of animated birds (lightweight flocking).Night ModeAt night, enable city lights, bridge beacons, street lights, vehicle lights, ship nav lights.Tech & Controls (Important)- Output MUST be a single self-contained HTML file (e.g., golden_gate_bridge.html) that runs by opening in Chrome.- No build tools (no Vite/Webpack). Pure HTML + JS.- Import Three.js and addons via CDN using ES Modules + importmap.- UI: nice-looking sliders for Time (0–24), Fog Density (0–100), Traffic Density (0–100), Camera Zoom.- Optimization: use InstancedMesh for repeated items (cars/lights/birds), avoid heavy geometry, keep draw calls low.

我们也可以顺便复习一下GPT-5.1的金门大桥。是不是已经区别不大了？

LMARENA的WebDev盲测榜位列第六

这可能是为数不多、不能刷的榜之一了。

为什么？因为它没有标准答案，它是基于大规模的用户进行双盲测试。

在WebDev分类排名，在我印象中，似乎还没有国产模型排名如此靠前过，何况GLM-4.7还是个开源模型。

用GLM 4.7平替Claude Code，中等难度以下任务无感

我们一直在期待“无感平替”

我们先简单闻闻味儿 —— 下面两个图，你能看出这是GLM 4.7吗？

我用了一下午都没看出来！我以为它是原生的Claude Sonnet模型呢，无论是行文风格、代码逻辑、情绪价值，都很像。

用GLM 4.7平替Claude Code，哪种任务会感觉有区别？

经过不断上难度测试，我发现，当我们遇到「需要跨越很多个上下文窗口」的复杂任务的时候，能够看出来GLM 4.7是略逊于最顶级模型的，有点小遗憾。

具体表现是：对于超复杂的长程任务，即便是事先写了特别长的文档，GLM-4.7也会偶发健忘，需要提醒。

这是因为，Claude Sonnet 4.5、Claude Opus 4.5、GPT-5.2-Codex等等2025年9月以后出现的最顶级编程模型，都训练“原生长程能力”，能够更好的跨越多个上下文窗口。因此，你可能之前看到过有人提到，用这几款模型，能够“自己卷自己好几个小时”。国产模型在这方面的能力，还没有赶上，相信不远的将来（也许3个月内）就会赶上！

好在，这样的任务并不多见，就算遇到了偶发健忘，也可以稍微多聊两句提醒提醒。 GLM 4.7 是目前国内最“无感平替”的Claude Code平替了。

如何在补齐GLM-4.7的多模态能力、联网搜索能力？

GLM包月套餐里提供了联网搜索、多模态能力，作为MCP接入。

详见这里

https://docs.bigmodel.cn/cn/coding-plan/mcp/vision-mcp-server

以视觉理解为例，在命令行里执行一句命令，就添加好了

claude mcp add -s user zai-mcp-server --env Z_AI_API_KEY=your_api_key -- npx -y "@z_ai/mcp-server"

不仅可以看懂图片，还能分析视频内容呢。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-29

8G 内存足以，最适合 NAS 的本地「多模态模型」，极空间+MiniCPM

2026-06-29

腾讯刚开源了个好东西：BrowserSkill 让 AI Agent 直接用你的浏览器

2026-06-29

WeKnora详解（一）：腾讯开源的 LLM 知识框架，5 分钟跑通你的第一个问答机器人

2026-06-29

腾讯WeKnora开源详解（四）：企业治理与开发者工具

2026-06-29

DeepSeek 再蒸新模型：这次选的是 Qwen3 和 Gemma4！Llama 这次上不了桌

2026-06-28

BrowserBC：克隆人类点击，让一次网页操作转化为所有Agent的能力

2026-06-27

腾讯混元发布 PhoneBuddy：4B 开源手机 Agent，在 AndroidWorld 上超越 Gemini3.1 Pro

2026-06-27

本地部署 Gemma 4 26B QAT 实践记录

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

Google Gemma 4 开源｜全面解读

2026-04-03

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

Ollama 本地部署 Gemma 4 完全指南

2026-04-18

Google Gemini CLI 完整使用指南

2026-04-18

Agent终于有了自己的邮箱！腾讯Agently Mail详解

2026-06-22

炸裂！Seedance 2.0 免费用！全网第一只接入的开源龙虾，效果离谱

2026-04-02

Claude 的金融 Skills 开源了

2026-05-10

Ollama 换引擎，苹果 M5 封神了

2026-05-06

Qwen3.7来了，全球排名第13，国内第一

2026-05-20

大家都在问

26.1%的AI编程技能有漏洞：NVIDIA开源 SkillSpector 能扫出什么？

2026-06-16

企业级 AI Agent 为什么集体转向“基座 + Skills”？

2026-05-30

Hermes Agent 深度解析：为什么它能“越用越懂你”？

2026-05-16

百度把Nano Banana塞进4090，疯了？

2026-04-22

Kimi K2.6 开源了！还附送了 300 个 Agent 员工？

2026-04-21

Hermes 凭什么两个月接棒 OpenClaw？

2026-04-15

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw