我要投稿

DeepSeekV3.1 提到的 UE8M0 FP8 Scale 是什么？下一代国产芯片设计？

发布日期：2025-08-21 20:01:28 浏览次数： 8520

作者：Safphere

微信搜一搜，关注“Safphere”

今天官方终于发布了对应的模型，并且在DeepSeek文章提到了一个“UE8M0 FP8 Scale ”

相信大家都会有些小好奇吧，带大家一起了解一下，这...究竟是什么

是谁的啊？好难猜哦~

UE8M0 是 DeepSeekV3.1 中提到的，在 FP8 训练中采用的一种参数精度配置：

E和M分别代表指数（Exponent）和尾数（Mantissa）的位数。

•U：表示无符号（Unsigned），可能针对激活值的非负特性优化。•E8M0：8位指数 + 0位尾数（需结合上下文推测具体实现，可能为特殊量化策略）。•FP8 Scale：指量化过程中用于缩放数值的因子（Scale），确保数值在 FP8 的表示范围内。

UE8M0的M=0并非字面意义的“0位尾数”，而是指动态尾数策略：

通过隐式归一化（如IEEE 754的隐藏位）或动态调整尾数精度（如Block-wise量化）实现灵活性。
实际实现中可能采用动态尾数分配（如根据指数范围动态调整尾数有效位）

不直白一点是什么？

根据 IEEE754 标准，浮点数在存储时分为三部分，符号位（通常1位）、指数位和尾数位。这样一来，浮点数的计算为 $(-1)^S * 2^(E-127) *M$（下面的图）。打个比方，浮点数 3.1 就可以表示为 0 10000000 10001100110011001100110。
所以对于 UE8M0（论文 https://arxiv.org/pdf/2506.08027 有提到(下方图中)），U 代表 unsigned 表示无符号位，E8 表示用8位表示指数位，M0 表示不存储尾数。
那么他的表示范围是多少呢？
我们来根据上面的式子计算。符号位S不存在，为0。指数位有8位，范围是0到255。尾数不存在，默认1。
这样一来 UE8M0 的表示范围为  2^{-127} to 2^{127}（但只能表示2的指数幂）。

太直白，太生硬了，留给专业的人看吧，我们看的更直观一点的信息。

UE8M0 的核心优势主要是计算效率提升，减低部署成本。

FP8 相比 FP16/FP32 减少 50%-75% 的显存占用，支持更大 batch size 或更长上下文（128K tokens）

在 NVIDIA H800 GPU 上，FP8 矩阵乘法速度比 FP16 快 2-3 倍

但与 OAI 开源的 gpt-oss 采用的FP4 还是有些差距。

希望在国产GPU上能拉进距离。

补充一些信息：

3.1做了外扩训练，增加了840B 的tokens。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-02-04

Skills使用体验

2026-02-04

AgentScope 正式发布 Skills 支持 - 实现渐进式披露

2026-02-04

从“回答者”进化为“研究员”：全面解析 Deep Research

2026-02-04

刚刚，Xcode 史诗级更新：原生集成 Claude Agent SDK，苹果开发直接起飞！

2026-02-04

国产 Cowork 它来了！MCP、Skills和Expert Agents都支持，全部免费体验！

2026-02-04

混元研究博客上线姚顺雨团队最新成果：从 Context 探索语言模型的范式转变

2026-02-04

通俗讲解大模型短期记忆 vs 长期记忆

2026-02-04

谁动了我的电脑？谁应该抱怨？

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Pencil：设计和写代码，以后就全让AI干了

2026-01-24

独家实录｜唐杰、杨植麟、林俊旸、姚顺雨...All Star 对话上，大家聊了啥？

2026-01-10

我挖到Gemini 3.0 Pro十大隐藏玩法，做网页已经落后N个版本了

2025-11-19

深度体验TRAE SOLO 正式版，总结一点技巧(附完整可重现提示词和源码)

2025-11-13

从0到1玩转Clawdbot：我花了40小时，把这些坑都踩完了

2026-01-26

2026 开年 AI 工具推荐，让你新的一年效率起飞！（建议收藏）

2026-01-01

Codex 史诗级更新！引入 Skills 技能库，直接兼容 Claude 生态，开发效率原地起飞

2025-12-09

国内版的 NotebookLM 来了，甚至更强

2025-11-12

终于！Gemini CLI支持Agent Skills，一键搬运Claude Code的“绝招”

2026-01-09

Claude赢麻了？OpenAI Codex正式支持Skills，GitHub连夜上车！

2025-12-21

大家都在问

谁动了我的电脑？谁应该抱怨？

2026-02-04

刚刚！OpenAI 正式发布 Codex App，一人指挥一支 AI 军队，Cursor 慌了？

2026-02-03

谷歌Genie 3打崩游戏股！1小时500元的AI生成游戏，真能革游戏的命？

2026-02-03

史上最强编程模型Claude 5泄露，最慌的是黄仁勋？

2026-02-02

X上点赞近万的Claude Agent SDK教程，到底讲了什么？

2026-02-02

人人都在谈论ClawdBot，但你真的懂它的技术原理吗？

2026-02-02

刚刚，谷歌版「世界模型」震撼公测！网友实测炸翻天：游戏末日来了？

2026-01-31

Transformers V5正式发布！这次更新到底香不香？

2026-01-30

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean

应聘简历请发送至： [email protected]

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部