微信扫码
添加专属顾问
我要投稿
GLM-4.7-Flash无审查版重磅发布,30B MoE架构带来高效推理体验,支持200K超长上下文,满足不同场景需求。 核心内容: 1. 模型特点:30B-A3B混合专家架构,仅激活3B参数实现快速推理 2. 版本选择:平衡版与激进版分别适用于不同应用场景 3. 技术细节:提供多种量化格式,兼容主流推理框架
GLM-4.7-Flash的无审查版本现已发布,由HauhauCS制作。该模型基于Z.ai的原版GLM-4.7-Flash,但移除了所有审查机制。
模型采用30B-A3B混合专家架构,总参数量31B,但每次前向传播仅激活约3B参数,这意味着推理速度会很快。同时支持200K的上下文长度。
目前提供了四种量化格式:
| 量化类型 | 文件大小 |
|---|---|
| FP16 | 56 GB |
| Q8_0 | 30 GB |
| Q6_K | 23 GB |
| Q4_K_M | 17 GB |
根据Z.ai官方的建议:
通用用途:
--temp 1.0 --top-p 0.95工具调用/智能体场景:
--temp 0.7 --top-p 1.0重要提示:
--repeat-penalty 1.0)--min-p 0.01(默认0.05过高)--jinja标志目前与Ollama存在聊天模板兼容性问题,建议使用llama.cpp、LM Studio、Jan或koboldcpp。
HauhauCS表示,这些无审查版本的目标是尽可能无损地保留原版模型的能力,只是移除了拒绝机制。对于需要更小模型的用户,他还发布了GPT-OSS 20B的无审查版本。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-03
Claude Code——智能路由与切换工具
2026-02-03
作为投资方,我们试了试Kimi K2.5
2026-02-03
暴涨11.7k Star!复刻Manus上下文工程的开源Skills,Claude code等多个平台即插即用
2026-02-03
ollama v0.15.4 更新:OpenClaw全面上线,优化集成流程与工具解析能力大升级!
2026-02-03
阶跃星辰 Step 3.5 Flash 上线!更快更强更稳的 Agent 大脑,开源!
2026-02-02
一分钟部署OpenClaw+QQ,国内最爽的一键启动!
2026-02-02
这家字节系AI初创,推出首个开源Agent Skills Builder!对话Refly.AI李锦威:大多数Agent都停留在专业用户层面,没有做到真正的普惠
2026-02-02
OCR又出宠OpenDoc,速度超MinerU6倍
2025-11-19
2026-01-27
2025-12-22
2025-12-10
2025-11-17
2026-01-12
2025-11-07
2025-12-23
2026-01-06
2026-01-29
2026-01-28
2026-01-26
2026-01-21
2026-01-21
2026-01-20
2026-01-16
2026-01-02
2025-12-24