我要投稿

GLM-4.7-Flash无审查版发布：30B MoE模型，仅3B激活参数

发布日期：2026-01-25 09:27:10 浏览次数： 3948

作者：AI工程化

微信搜一搜，关注“AI工程化”

GLM-4.7-Flash的无审查版本现已发布，由HauhauCS制作。该模型基于Z.ai的原版GLM-4.7-Flash，但移除了所有审查机制。

模型采用30B-A3B混合专家架构，总参数量31B，但每次前向传播仅激活约3B参数，这意味着推理速度会很快。同时支持200K的上下文长度。

两种变体

平衡版：适合需要可靠性的智能体编码场景，在保持能力的同时不会过度拒绝请求
激进版：适合其他所有无审查主题

量化版本

目前提供了四种量化格式：

量化类型	文件大小
FP16	56 GB
Q8_0	30 GB
Q6_K	23 GB
Q4_K_M	17 GB

技术规格

模型架构：30B-A3B MoE（31B总参数，~3B激活参数）
上下文长度：202K
基础模型：zai-org/GLM-4.7-Flash

兼容性

目前与Ollama存在聊天模板兼容性问题，建议使用llama.cpp、LM Studio、Jan或koboldcpp。

HauhauCS表示，这些无审查版本的目标是尽可能无损地保留原版模型的能力，只是移除了拒绝机制。对于需要更小模型的用户，他还发布了GPT-OSS 20B的无审查版本。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-23

百度开源 Unlimited OCR：让长文档解析一次完成

2026-06-23

我把自己的需求到交付 Skills 开源了：Analysis to Delivery

2026-06-23

腾讯开源WeKnora知识库部署实战(含踩坑排查)

2026-06-22

DiffusionGemma: 文本生成速度提升 4 倍

2026-06-22

刚刚，百度开源拿下全球第一！作者疑似DeepSeek出走大神

2026-06-22

Agent终于有了自己的邮箱！腾讯Agently Mail详解

2026-06-20

GLM-5.2本地部署：744B参数模型如何在Mac上跑

2026-06-20

Hermes Agent v0.17发布：AI助手开始扩展触角

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Hermes Agent 出来了，聊聊它凭什么跟 OpenClaw 掰手腕

2026-03-30

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

Google Gemma 4 开源｜全面解读

2026-04-03

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

刚刚，Claude Code开源了！51万行代码，全网狂欢

2026-03-31

龙虾绝配：Qwen 3.5 27B！跑在家里，成本为 0

2026-03-30

Ollama 本地部署 Gemma 4 完全指南

2026-04-18

Google Gemini CLI 完整使用指南

2026-04-18

CoPaw深度解析：源码架构和功能实践

2026-03-31

炸裂！Seedance 2.0 免费用！全网第一只接入的开源龙虾，效果离谱

2026-04-02

大家都在问

26.1%的AI编程技能有漏洞：NVIDIA开源 SkillSpector 能扫出什么？

2026-06-16

企业级 AI Agent 为什么集体转向“基座 + Skills”？

2026-05-30

Hermes Agent 深度解析：为什么它能“越用越懂你”？

2026-05-16

百度把Nano Banana塞进4090，疯了？

2026-04-22

Kimi K2.6 开源了！还附送了 300 个 Agent 员工？

2026-04-21

Hermes 凭什么两个月接棒 OpenClaw？

2026-04-15

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw

GLM-4.7-Flash无审查版发布：30B MoE模型，仅3B激活参数

两种变体

量化版本

技术规格

推荐设置

兼容性