微信扫码
添加专属顾问
我要投稿
Google黑客松全球第三名得主分享:如何用Causal AI革新RAG技术,解决商业场景中的深层问题。 核心内容: 1. Causal RAG的创新思路:结合轻量级概化模型与传统RAG 2. 当前RAG技术在定量问题上的局限与突破方向 3. 财报分析等商业场景中的实际应用案例
3. 为什么选择Causal AI构建概化模型?
答:还有什么其他更好的选择吗(笑)?我们需要概化模型支持因果关系、能够实现自主推理和对Hypothesis的自我验证;但传统的ML和DL表达的是相关性、基于大模型Deep Research并不支持对Hypothesis的验证、知识图谱只有定性没有定量、而我们在严谨的商业领域几乎不需要RL Trial-and-Error式的搜索。基于以上原因,Causal AI几乎是唯一的选择。
4. 那么以LLMs产生Code的原因是?
答:经典的Causal AI主要聚焦于发现系统变量间的因果结构,并据此执行干预(Intervention)与反事实(Counterfactual)推理。在存在Unobservables变量时,其通常依赖数据科学家的假设与人工建模来保证因果效应的可识别性。
而绝大多数商业场景(例如,财务与运营)的因果结构往往较为稳定,甚至由恒定式构成;问题的核心不在于“发现新因果”,而在于在复杂系统中定位根因与优化路径。因此,这类问题更接近一种搜索过程,更适合通过大模型生成Code在概念模型中进行检索与自主推理。
基于此,Causal RAG的范式可以描述为:
图3:Causal RAG范式
其中,大模型在概念上是由Transformer实现,基于Token Level的贝叶斯网络( P(Xt|X<t) )。该贝叶斯网络在叠加由Causal Graph、Sentiments和相关Data构成的概念模型(Approximation)之后产生Code,并由代码逻辑在概念模型的范围内进行推理和检索。
5. Causal RAG的实现效果如何?
答:我们设计了一套财报问题以对比Causal RAG,Baseline RAG,以及SOTA模型的表现(Gemini-2.5-Pro)。该体系包括四类问题:1)浅层事实类问题(Basic Fact);2)浅层计算类问题(Calculation);3)Why类问题(Drivers);4)深层时间序列类问题(Trends)。
测试结果表明,Causal RAG在各个类别问题的表现都明显优于Baseline RAG。而另外一个有趣的发现是,虽然Gemini Pro 2.5有1M大小的Context Window,但其却难以应对基于多个PDF的时间序列查询(例如,鉴别Salesforce在某年的财报异常需要比对连续多年的基线数据);但Causal RAG则在此类问题上表现非常稳定。
图3:测评结果,Causal RAG的基座模型是Gemini Flash 2.5
6. 这个方案中Vector Search的成分岂不是很薄?
答: Embedding Search/Similarity Search本就是非常孱弱的检索体系。Causal RAG只是将其“归位” - 用于提供对推理结果的佐证。当然,当前方案的Vector Search还较为粗放,更细粒度的方案应该是根据Facts/Insights的情况逐条进行佐证。
7.所以Causal RAG会取代传统RAG吗?
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-04
Skills使用体验
2026-02-04
AgentScope 正式发布 Skills 支持 - 实现渐进式披露
2026-02-04
从“回答者”进化为“研究员”:全面解析 Deep Research
2026-02-04
刚刚,Xcode 史诗级更新:原生集成 Claude Agent SDK,苹果开发直接起飞!
2026-02-04
国产 Cowork 它来了!MCP、Skills和Expert Agents都支持,全部免费体验!
2026-02-04
混元研究博客上线姚顺雨团队最新成果:从 Context 探索语言模型的范式转变
2026-02-04
通俗讲解大模型短期记忆 vs 长期记忆
2026-02-04
谁动了我的电脑?谁应该抱怨?
2026-01-24
2026-01-10
2025-11-19
2025-11-13
2026-01-26
2026-01-01
2025-12-09
2025-11-12
2026-01-09
2025-12-21
2026-02-04
2026-02-03
2026-02-03
2026-02-02
2026-02-02
2026-02-02
2026-01-31
2026-01-30