我要投稿

揭秘AI内部机制：AI理解的重大突破

发布日期：2025-04-06 05:07:29 浏览次数： 1994

作者：清熙

微信搜一搜，关注“清熙”

Anthropic本周连发两篇相互关联的大模型内部机制研究报告【文献1、文献2】：

构建了AI“显微镜”，并用它追踪了大模型思维，这是继去年揭秘大模型黑盒之后的重大进展。

【文献1】构建了替代模型（replacement model）作为AI“显微镜”

通过这个替代模型，亦步亦趋的捕获针对每一个提示语的归因图（attribution graph）

归因图用于描述模型在特定输入提示下生成目标词元输出时所经历的推理步骤。

归因图的边表征节点间的线性影响关系，节点代表以下对象：

激活的特征
输入提示中的词元嵌入
重构误差
输出逻辑值

每个特征的活动强度由其输入边的权重之和决定。

归因图展示了特征如何在特定输入提示下相互作用以生成模型输出。

而特征在所有上下文环境中交互的全局图景更值得关注，全局交互由模型权重决定：

相邻层神经元间的直接影响就是它们之间的连接权重；若神经元间隔较远，则影响会通过中间层传递。

这本质上是笔者在降低大模型幻觉的必由之路中描述的 Transformer视角下的范畴中采样，即在复杂高维的对象米田嵌入图中的采样路径。

学者们接着在【文献2】中应用此AI“显微镜”对自家大模型Claude 3.5 Haiku在多种情景下内部机制做了“生物学”探查，非常有趣。

笔者关注到两个情景：诗歌中的规划和多语言电路，很有感触和共鸣。

诗歌规划，研究发现大模型在写诗行时提前计划其输出：

在开始编写每一行之前，模型会识别可能出现在末尾的押韵单词，预先选择的押韵选项将决定模型构建整行的方式。

这颠覆了大模型仅仅做下一个词元预测的流行的行业错误认知，大模型是这么学习语料的，但不代表也是这么推理生成的。

诗词韵律规划更符合笔者在MIT对大模型数理原理的强有力证明中描述的采样过程：

“在外部感官输入下（被提示置于某种上下文），大模型内部将限定在相应的高维语言概率空间的子空间内推理；推理是在子空间中采样，类比时跨范畴采样；

采样不断进行，基于内部概率化了的世界模型（预训练获得的先验），针对感官输入（提示），做变分推断，最小化自由能，获取最佳采样分布q*，作为对导致感官输入的外部后验的预测。”

多语言电路，研究发现大模型混合使用了“特定于语言的”，和“抽象的、独立于语言的”电路，更大的模型中，“抽象的、独立于语言的”成分更突出。

这非常贴切的印证了笔者在 DeepSeek R1 & R2 技术原理中，对大模型中不同层次/尺度语言处理机制的描述：

人类与大模型的语言体系中具有共通的三层结构：

自下而上，基础“信息概率分布”处理体系；
自然语言如语音或词句文章；
符号语言如代码、数学公式等。

而推理不过是在LLM构建的高维概率语言空间里，对信息概率分布采样做变分；

这个过程可以映射到不同的上层自然语言，以及对应的语音，甚至进一步映射到某种符号语言 - 代码或数学公式；

而抽象的符号语言也可以用自然语言描述，从而进一步转换为对信息概率分布的处理过程。

Anthropic团队对大模型内部机制的探索不断取得重要进展，越来越接近模型本质的机理。与目前来自Nature，Science，学术界，企业界的几十项研究成果一样，均指向这一数理认知框架。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-12-17

吴恩达最新课程：别再只写Prompt了！掌握Agentic AI，让AI自主工作！

2025-12-17

开发者能用 ChatGPT App 赚钱了｜机会，留给晚睡的人

2025-12-17

一位网友逆向破解了 ChatGPT 记忆系统，给我干破防了

2025-12-16

深度研究：我们如何构建水平最先进Agent

2025-12-16

原来ChatGPT的记忆是这么做的

2025-12-16

陈天桥丨系统的融化：从AI赋能到AI原生

2025-12-16

Google Disco：新型浏览器+Gemini3，信息不只是文字总结

2025-12-16

Claude MCP 和 Skills 的微妙关系

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

从需求场景出发的AI应用项目落地方法论

2025-09-19

马斯克 Grok imagine 完整使用指南：工具、案例、提示词，看这一篇就够了！

2025-10-26

实测 Sora 2 ：AI视频的“ChatGPT时刻”来了？八大场景教你解锁各种玩法（附邀请码）

2025-10-02

RagFLow v0.20.X全面解析！双向MCP、Agentic智能体...这次真的起飞了！（附长图）

2025-09-29

一文速览OpenAI Dev Day 2025，下半年开始大洗牌

2025-10-07

Claude Sonnet4.5发布，号称世界最强模型，超越gpt-5-codex

2025-09-30

我挖到Gemini 3.0 Pro十大隐藏玩法，做网页已经落后N个版本了

2025-11-19

万字长文深度解析最新Deep Research技术：前沿架构、核心技术与未来展望

2025-10-20

深度体验TRAE SOLO 正式版，总结一点技巧(附完整可重现提示词和源码)

2025-11-13

Sora 2带来3个颠覆性创新，这个行业或将被彻底重构

2025-10-02

大家都在问

Prompt是与LLM对话的唯一方式：如何给大模型装上能指挥“手脚”的脑子？

2025-12-16

200k Tokens 的上下文真的够用吗？

2025-12-15

巨头翻身！谷歌全新AI浏览器Disco问世，PC版灵光？

2025-12-14

2025年，企业级AI的主战场在哪里？

2025-12-12

GPT 5.2的长上下文厉害了，但是写文真的强吗？

2025-12-12

涌现观点｜AI 开发的"App Store 时刻"：为什么你应该停止构建 Agent？

2025-12-11

Human In the Loop竟然可以是个MCP?

2025-12-09

AI会消灭搜索吗？

2025-12-08

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： [email protected]

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部