微信扫码
添加专属顾问
我要投稿
国产AI模型GLM-4.7编程能力惊艳,实测与Claude Code难分伯仲,还能省下一笔钱!核心内容: 1. GLM-4.7在前端开发任务中的出色表现 2. 与Claude Code的详细对比测试结果 3. 开源模型突破性进展的行业意义
哈喽,大家好,我是刘小排。
GLM 4.7发布了,从客观数据看,编程方面进步很大。
智谱可能是国内最早打“平替Claude”牌的AI厂商了,对于智谱的新模型,我也毫不犹豫用Claude Code来测试,看看这次平替能力是否进步了。
先说结论:
我把Claude Code换成 GLM-4.7 用了6小时,竟然没发现明显区别,最明显的区别是省钱了。
省流版
前端能力进步很大,审美极强。
用GLM-4.7驱动Claude Code,中等难度以下任务,几乎感觉不到和原版有区别。高难度任务(如:需要反复压缩上下文跨越多个上下文窗口的情况),能够看出来有区别,相比Claude Code原版更容易健忘。
有点难以置信:在LMARENA的WebDev盲测榜中,GLM-4.7位列全球第六,甚至超过了GPT-5.2。
GLM-4.7是开源的,史上编程能力最强的开源模型!老外一定会深感震撼,按照某些美国明星科技企业的秉性,稍后等他们一起床,就会开始套壳了。
GLM Coding Plan 20人民币/月的套餐 值得购买,下文有二维码。
小遗憾:暂时不是多模态(可以通过MCP来补);上下文长度200K,属于中等长度。
下面我们稍微展开讲讲。
如何在Claude Code里使用GLM 4.7?
这里点赞一下智谱官方的贴心和专业。无论是Claude Code、还是Cline、Droid,所有开发者常用的工具,官方都做了教程。
https://docs.bigmodel.cn/cn/coding-plan/tool/claude-for-ide
我同时在Claude Code IDE插件、 Claude Code CLI、Droid、Cline里设置了GLM 4.7。四个方式我都感受了,我认为是在Claude Code IDE插件/Claude Code CLI里,GLM 4.7的体验最好。
前端能力进步很大
在前两个月,但凡Google/OpenAI/Anthropic发布了新的模型,都会引入一个“金门大桥测试”。
这个测试非常难,以前用国产模型做,效果都不太好。因为这个任务还挺难的,是一个综合性特别强的任务,包括需要有世界知识、需要有物理知识、需要3D细节、可交互镜头、雨天地面湿润反光等等。
GLM-4.7很争气,一次搞定。
不过,可能是因为这个任务太难了,第一次做出来的时候,性能不是特别好。我再额外和GLM-4.7单聊了一会儿优化性能的事。
下面请欣赏, GLM-4.7完成的金门大桥。
怀疑作弊?我没有作弊,你可以复现!我来公布原始Prompt,你使用这一段Prompt,发给GLM-4.7,你也能得到同样的效果! 震不震惊?
ObjectiveBuild a visually stunning, high-fidelity 3D voxel-style simulation of the Golden Gate Bridge in Three.js.Prioritize complex visuals (not simple blocks), strong atmosphere depth, and smooth ~60FPS.Visuals & Atmosphere- Lighting: a Time-of-day slider (0–24h) that controls sun position, intensity, sky color, and fog tint.- Fog: volumetric-feeling fog using lightweight sprite particles; slider 0–100 (0 = crystal clear, 100 = dense but not pure whiteout).- Water: custom shader for waves + specular reflections; blend horizon with distance-based fog (exp2) so the far water merges naturally.- Post: ACES filmic tone mapping + optimized bloom (night lights glow but keep performance).Scene Details- Bridge: recognizable art-deco towers, main span cables + suspenders, piers/anchors consistent with suspension bridge structure.- Terrain: simple but convincing Marin Headlands + SF side peninsula silhouettes.- Skyline: procedural/instanced city blocks on the SF side to suggest depth.- Traffic: up to ~400 cars via InstancedMesh, properly aligned on the deck (avoid clipping). Headlights/taillights emissive at night.- Ships: a few procedural cargo ships with navigation lights moving across the bay.- Nature: a small flock of animated birds (lightweight flocking).Night ModeAt night, enable city lights, bridge beacons, street lights, vehicle lights, ship nav lights.Tech & Controls (Important)- Output MUST be a single self-contained HTML file (e.g., golden_gate_bridge.html) that runs by opening in Chrome.- No build tools (no Vite/Webpack). Pure HTML + JS.- Import Three.js and addons via CDN using ES Modules + importmap.- UI: nice-looking sliders for Time (0–24), Fog Density (0–100), Traffic Density (0–100), Camera Zoom.- Optimization: use InstancedMesh for repeated items (cars/lights/birds), avoid heavy geometry, keep draw calls low.
我们也可以顺便复习一下GPT-5.1的金门大桥。 是不是已经区别不大了?
LMARENA的WebDev盲测榜位列第六
这可能是为数不多、不能刷的榜之一了。
为什么?因为它没有标准答案,它是基于大规模的用户进行双盲测试。
在WebDev分类排名,在我印象中,似乎还没有国产模型排名如此靠前过,何况GLM-4.7还是个开源模型。
用GLM 4.7平替Claude Code,中等难度以下任务无感
我们一直在期待“无感平替”
我们先简单闻闻味儿 —— 下面两个图,你能看出这是GLM 4.7吗?
我用了一下午都没看出来!我以为它是原生的Claude Sonnet模型呢,无论是行文风格、代码逻辑、情绪价值,都很像。
用GLM 4.7平替Claude Code,哪种任务会感觉有区别?
经过不断上难度测试,我发现,当我们遇到「需要跨越很多个上下文窗口」的复杂任务的时候,能够看出来GLM 4.7是略逊于最顶级模型的,有点小遗憾。
具体表现是:对于超复杂的长程任务,即便是事先写了特别长的文档,GLM-4.7也会偶发健忘,需要提醒。
这是因为,Claude Sonnet 4.5、Claude Opus 4.5、GPT-5.2-Codex等等2025年9月以后出现的最顶级编程模型,都训练“原生长程能力”,能够更好的跨越多个上下文窗口。因此,你可能之前看到过有人提到,用这几款模型,能够“自己卷自己好几个小时”。国产模型在这方面的能力,还没有赶上,相信不远的将来(也许3个月内)就会赶上!
好在,这样的任务并不多见,就算遇到了偶发健忘,也可以稍微多聊两句提醒提醒。 GLM 4.7 是目前国内最“无感平替”的Claude Code平替了。
如何在补齐GLM-4.7的多模态能力、联网搜索能力?
GLM包月套餐里提供了联网搜索、多模态能力,作为MCP接入。
详见这里
https://docs.bigmodel.cn/cn/coding-plan/mcp/vision-mcp-server
以视觉理解为例,在命令行里执行一句命令,就添加好了
claude mcp add -s user zai-mcp-server --env Z_AI_API_KEY=your_api_key -- npx -y "@z_ai/mcp-server"不仅可以看懂图片,还能分析视频内容呢。
GLM Coding Plan 包月套餐
GLM Coding Plan仍然是良心价格。比20元/月更划算的是54元/季。
可以扫码购买试试看。
期待交流。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-23
通义百聆语音交互模型开源,创新架构可节省近50%GPU计算!
2025-12-23
OxyGent 多智能体协作框架新版本发布
2025-12-23
MinIO 停更仅维护!Milvus 对象存储替代方案怎么选
2025-12-23
MiniMax M2.1:多语言编程SOTA,为真实世界复杂任务而生
2025-12-23
OpenAgents:让AI智能体像人类一样联网协作
2025-12-23
智谱GLM-4.7:更强的代码,更好的美学
2025-12-22
Notesnook:一款完全开源、以隐私为核心的笔记应用
2025-12-22
一文彻底看懂 Google 最新开源 A2UI 协议:如何让 AI Agent “说出UI” ?
2025-11-19
2025-10-20
2025-10-27
2025-10-27
2025-10-03
2025-09-29
2025-11-17
2025-10-29
2025-09-29
2025-11-07
2025-12-22
2025-11-12
2025-11-10
2025-11-03
2025-10-29
2025-10-28
2025-10-13
2025-09-29