微信扫码
添加专属顾问
我要投稿
GLM-4.5强势归来,国产AI模型新标杆!原生融合推理、代码与Agent能力,一句话生成动态网站不是梦。 核心内容: 1. GLM-4.5的突破性定位:原生多能力融合的Agent基座模型 2. 实测案例展示:从搜索网站到3D地球的惊艳表现 3. 技术实力验证:12项基准测试全球第三、国产第一的成绩
华夏模型多俊秀,敢教日月焕新天。
最近,国产模型真是一个比一个还顶。
刚刚,智谱发布了他们的新一代旗舰模型GLM-4.5,并在Hugging Face上同步开源。我提前拿到了内测,狠狠的跑了一波case,但是我不知道该怎么形容这个模型。
它不是Claude 4这类代码很强的模型,也不是o3、o4mini这类推理很牛的模型。它或许谁也不是,它就是智谱GLM-4.5,一个在基础模型中原生融合了推理、代码、Agentic等多能力的Agent基座模型。
对,Agent基座模型,这可能是最适合GML-4.5的定位。
这个模型有多强呢?在12个评测基准中的平均分,它取得了全球第三、国产第一的成绩,达到开源SOTA。
现在,上智谱清言(chatglm.cn)或Z.ai,即可体验GLM-4.5。
一手实测
真实体验,胜于榜单,给大家看一些我跑的case。
1)「爱搜」网站
开发一个名为"爱搜"的AI搜索网站,你什么都不用做,也别管什么部署,只用输入这句Prompt就行。
参考Perplexity做一个搜索网站,这个网站叫“爱搜”,slogan“爱搜,才会赢”。
速度也是极快,大概2分钟左右,一个真实可用的网站就开发好了。
这个网站的链接,我放这里了,欢迎访问:
https://f0fae623pbx1-deploy.space.z.ai
这是真的一句话生成应用网站。它不是静态的前端网页,而是可真实交互的动态网页,有后端,有搜索API,还有数据储存。
代码什么的,不用你敲;ui什么的,不用你找;API什么的,也不用你管。你只需要,口喷需求就行。
最近,我体验过不少所谓“全栈开发”的Agent和coding工具,虽说是低代码,但还是要自己去授权、去注册API啥的。一套流程下来,其实并不简单。
而GLM-4.5,是真·一句话生成应用网站,还是模型原生的那种,对小白极度友好。
2)共享功德箱
设计一个共享功德箱的网站, 鼠标点击+1点功德 , 保存到数据库。同时,配备一个管理员页面, 可以手动修改总功德数。
这个网站大家都可以玩,你可以来试下,还支持手动改功德数,也就是有数据库功能。
共享功德箱:
https://n0aap68at9v0-deploy.space.z.ai
3)3D地球
用GLM-4.5做一个3D地球网页,用户可以点击地点查看详情,还有缩放动画。
使用Three.js和JavaScript构建一个网页,创建一个基于数组的 3D 世界,展示我去过的地方。点击 3D 地球上的标记将触发缩放动画效果,并打开带有照片的详细旅行信息。
GLM-4.5这数据处理、交互动画设计能力,也是相当优秀。
4)3D粒子星系
创建一个3D粒子星系,有漩涡星云,动态光照。
这效果太棒了,就是我电脑的CPU快被这渲染给撸冒烟了。熟悉沃垠AI的朋友应该知道,这个prompt我们在R1、Gemini 2.5 pro、o3等模型里都跑过,只有K2和GLM-4.5能够直出这么棒的效果。
5)辛顿WAIC演讲PPT
周末,大家都被WAIC杰弗里·辛顿的演讲刷屏了吧。大佬确实是大佬,就是PPT有点朴实无华。
我用GLM-4.5把大佬的PPT,重新做了一版。
请用清晰的可视化方式介绍资料的每个部分,突出每一页的内容主题,整体风格上可以融入巨型数据瀑布翻滚 / 字节构成的环形词语在空中跳跃,整体是星际穿越的风格,要求图像视觉化强,不要文字堆叠的排版习惯,科技风。
这视觉效果,没得说。
欢迎大家复制下方的链接查看,动态效果远比这几张静态图要好看很多。
辛顿PPT:
https://chat.z.ai/space/k05ay60yjm71-ppt
6)弹幕PPT
请用5页PPT说服我,为什么我要用智谱Z.ai。高级黑白金属风,PPT除首页外,每一页都加弹幕。
弹幕类PPT,它也能做。这里推荐大家一个技巧,在你的PPT提示词中加入“高级黑白金属风”这句prompt,可以让你的PPT更高级。
7)吐槽GPT-5
联网搜索,大家是怎么吐槽GPT-5的(重点是英文资讯和海外社交媒体),生成一个PPT演示网页,贴吧暴躁老哥风格。
信息检索质量这块,智谱一直都很强,而且还能检索很多外网信息,很靠谱。
8)MD转HTML编辑器
开发一个排版编辑器,能自动将Markdown文本转为精美的html网页。
这个编辑器,支持实时预览和精美HTML输出,欢迎大家体验。
MD编辑器:
https://chat.z.ai/space/w0rac6dv4qq1-art
9)番茄时钟
开发一个现代化的番茄时钟应用:
【核心功能】25分钟专注+5分钟休息的循环计时
【视觉效果】圆形进度条动画+舒缓的配色方案
【音效提醒】设置开始/结束的温和提示音
【数据统计】记录今日完成的番茄数量和专注时长
番茄时钟该有的功能,它基本都有,UI也让人很舒服,毛玻璃效果+按钮涟漪效果很适配移动端,还有提示声音。这个闹钟,我自己已经在用了。大家有需要的,可以直接复制下方链接,使用。
番茄时钟:
https://chat.z.ai/space/n06as6c181j1-art
10)小游戏三款
测试过程中,我还用GLM-4.5开发了几个好玩的小游戏,欢迎大家来玩。
10.1 颜色记忆大师
请实现一个颜色记忆游戏(类似 Simon Game)。四个不同颜色的按钮会依次闪烁(形成一个序列),玩家需在下一轮准确复现。每轮会增加一个颜色,难度逐渐上升。需实现错误提示、最高连击统计、音效模拟(可用 Web Audio API)。
我玩到第7轮就记不住了,看看你能坚持到第几轮呢。
颜色记忆大师:
https://chat.z.ai/space/a0ja663sz370-art
10.2 反应力测试
请用 HTML/CSS/JS 实现一个“反应力测试小游戏”:画面上有一个小黑块随机出现,你需要用鼠标点击它,越快越好,系统会记录你的反应时间。连续10次后给出统计数据:平均反应时间、最快/最慢一次、反应偏差图表。界面简洁,响应迅速,可在手机端适配。
哈哈,说起反应力,那一定是我的擅长领域了,毕竟曾经Dota APM(Actions Per Minute,每分钟键鼠操作次数)一直保持100+。
反应力测试:
https://chat.z.ai/space/r07a164a9pu0-art
10.3 愤怒的小球
**任务:**
开发一个类似《愤怒的小鸟》的2D物理弹射游戏,我们称之为《愤怒的小球》。
**核心玩法:**
在一个固定的发射区域,玩家通过向后拖拽鼠标来为一个“小球”蓄力并设定角度。松开鼠标后,小球按计算出的轨迹被发射出去,目标是击倒远处的几个目标物(例如,堆叠的方块)。
**具体要求:**
1. **HTML/Canvas 设置:**
* 使用 `<canvas>` 绘制所有游戏元素:小球、发射区域(弹弓)、地面、以及目标物。
* 显示发射次数或得分。
2. **JavaScript 逻辑:**
* **向量化输入:**
* 监听 `mousedown`, `mousemove`, `mouseup` 事件。
* `mousedown` 时记录起始点。
* `mousemove` 时,计算当前鼠标位置与起始点的位移向量。这个向量的 **反方向** 和 **大小** 将决定小球的初始速度向量 $(v_x, v_y)$。
* `mouseup` 时,发射小球。
* **弹道物理计算:**
* 一旦发射,小球的运动应遵循抛物线轨迹。
* 水平方向:$x(t) = x_0 + v_x \cdot t$ (忽略空气阻力)
* 垂直方向:$y(t) = y_0 + v_y \cdot t + 0.5 \cdot g \cdot t^2$ (其中 g 是重力常数)。
* 在游戏循环中,根据时间增量 `dt` 来迭代更新小球的位置和速度。
* **碰撞检测:**
* 实现小球与地面(一条水平线)的碰撞,并带有一定的弹性能量损失(弹跳几次后停止)。
* 实现小球与目标物(矩形)的精确碰撞检测。
* **目标物物理反馈:**
* 当小球击中目标物时,目标物应根据被击中的力量和角度做出反应(例如,被推开、倒下)。(这是一个简化要求,即使只是简单地使其消失并得分也可以)
* **游戏重置:** 提供一个按钮或机制,用于重置小球到发射区,准备下一次发射。
**挑战与扩展(可选):**
* **绘制弹道预测线:** 在玩家拖拽时,根据当前的发射向量实时计算并绘制出前一小段的预测轨迹。
* **可破坏的方块:** 实现一个简单的结构,当支撑方块被移除时,上方的方块会因重力下落。
* **镜头移动:** 如果关卡较大,当小球飞出屏幕时,镜头可以跟随小球移动。
**最终产物:**
一个包含了完整物理交互逻辑的 `index.html` 文件。
这个游戏也很好玩,适合女生,很解压。
愤怒的小球:
https://chat.z.ai/space/x0kaf60krr61-art
怎么使用?
一轮实测下来,这个模型是真的强。
10+case里,覆盖了前端网页、HTM式PPT、应用网站和小游戏开发,GLM-4.5都能够开发,而且基本上是一次直出。无论是简单prompt还是复杂prompt,都能轻松应对。
关键问题来了,这个模型可以在哪里使用?
1)AI Chat端
在智谱清言(chatglm.cn)和Z.ai上,可直接体验满血版GLM-4.5,免费、不限量。
如果你的应用,带有后端(比如有数据库、管理后台之类),请勾选“全栈开发”。如果是PPT,则勾选“PPT”。这样,效果会更好。
如果是日常通用类,则直接在左上角,选“GLM-4.5”模型就可以了。
2)API调用
如果需要在Cursor、Trae等IDE里调用GLM模型,则需要到智谱AI开发平台bigmodel.cn配置API。
价格超级便宜,低至输入0.8元/百万tokens,输出2元/百万tokens,比R1、K2、Qwen3 coder都要便宜。更别说跟Claude 4比了,那个简直就是大模型奢侈品。
对了,他们家也是兼容Claude Code、Cline、Roo Code、Gemini CLI的,通过bigmodel.cn(海外用户在Z.ai接)接入API,可以畅跑。
考虑到最近Coding模型API实在太贵,他们还搞了个“50块包月爽用GLM-4.5”的活动,真的太给力了。
生成速度也是超快,高速版(GLM-4.5X)生成速度超过100 tokens/秒,很适合低延迟、高并发的部署需求。
参数这块,GLM-4.5总参数355B,激活参数32B,是R1的1/2、K2的1-3。参数虽小,但表现同样出色,这得益于GLM模型的更高参数效率。
特别是GLM-4.5-Air这款,以106B总参数、12B激活参数实现了国产模型的新突破,在Artificial Analysis推理基准上超越了Gemini 2.5 Flash、Claude 4 Opus等模型,性能位列国产前三。
写在最后
前天,来中国参加WAIC的大佬Geoffrey Hinton(杰弗里·辛顿),他在2020年底提了一个观点“智能不够,参数来凑”。
现在,我们的LLMs颇有点“智能不够,模型来凑”的意思。基础模型,搞一款;推理,再出一款;视觉推理,又来一款;Agent火了,马上推出Agentic模型。
比如“模多多”OpenAI,他们家的模型命名和版本是真够混乱的,别说普通消费者,就连我这样的从业者都不一定能搞清楚。这颇有点像“拿着靶子找箭”,为了能让箭矢射中靶心,于是开发了各种各样的弓,但就是没有能适配所有士兵的通用弓。
某位湖南大佬曾说过,“路线是纲,纲举目张”。今天,智谱推出的GLM-4.5,有点像是在给当前混乱的大模型分类,重新找到了一个方向,即All model in one。
衡量AGI的第一性原理,是在不损失原有能力的前提下融合更多的通用智能能力,GLM-4.5便是智谱对此理念的首次完整呈现。首次在单个模型中,实现了推理、代码、Agentic等多能力的原生融合,而且效果很好。
GLM-4.5,是我今年体验过最好的Agent基座模型。
而且,它还开源。
这就很智谱,非常的智谱,是那个一直在探索AGI上限上给我们带来惊喜的智谱。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-08-29
如何评测 AI 智能体:试试字节开源的扣子罗盘
2025-08-29
HiMarket 正式开源,为企业落地开箱即用的 AI 开放平台
2025-08-28
美团 M17 团队开源 Meeseeks 评测集:揭秘大模型的 “听话”能力
2025-08-28
我摊牌了,PDF的终结者出现了!这个开源神器,让你的RAG项目吞吐能力暴增10倍!
2025-08-28
面壁开源多模态新旗舰MiniCPM-V 4.5,8B 性能超越 72B,高刷视频理解又准又快
2025-08-28
1.9K Star 微软开源TTS王炸!90分钟超长语音合成,4人对话自然切换!
2025-08-27
初探:从0开始的AI-Agent开发踩坑实录
2025-08-27
ollama v0.11.7发布:深度集成DeepSeek-V3.1与Turbo云端推理模式解析
2025-07-23
2025-06-17
2025-08-20
2025-06-17
2025-07-23
2025-08-05
2025-07-14
2025-08-20
2025-07-29
2025-07-12