免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

AAAI-26 | Cog-RAG:用双超图,重构RAG的认知流程

发布日期:2025-11-25 10:18:38 浏览次数: 1673
作者:PaperToday

微信搜一搜,关注“PaperToday”

推荐语

AAAI-26重磅研究:Cog-RAG用双超图模拟人脑认知,突破传统RAG的语义割裂困境。

核心内容:
1. 传统RAG的"实体孤岛"问题与现有解决方案的局限性
2. Cog-RAG双超图架构设计:主题超图+实体超图的协同机制
3. 两阶段检索流程实现"先主题后细节"的认知式知识获取

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
Cog-RAG: Cognitive-Inspired Dual-Hypergraph with Theme Alignment Retrieval-Augmented Generation  
西交、清华、西电联合团队 
https://arxiv.org/pdf/2511.13201

一、当 RAG 陷入“实体孤岛”

Retrieval-Augmented Generation(RAG)已经成为大模型落地垂直领域的“标配外挂”——把私域文档切成 chunk,做向量索引,回答时召回最相似的片段喂给 LLM,简单粗暴却有效。
但扁平的向量相似度检索天生有两个缺陷:

  1. 跨 chunk 语义割裂:无法显式建模 chunk 之间的依赖或主题演化,导致召回内容“碎片化”。
  2. 高阶关系缺失:基于向量的方法只能做“点对点”匹配,难以刻画“多实体联合”的复杂语义。

近两年,GraphRAG、LightRAG 等工作把实体级知识图谱搬进 RAG,用“边”把实体串起来,一定程度上缓解了割裂问题。
然而,图谱仍然只关注“成对关系”,对于“多个实体共同构成一个事件/主题”的高阶依赖束手无策,如图 1(a)(b) 所示。

二、双超图 + 两阶段检索,模拟“人脑自上而下”的阅读过程

2.1 总体框架

Cog-RAG 的核心思想一句话概括:先找主题,再找细节,像人一样先快速浏览目录把握主旨,再定位到关键段落精读。
为此,作者设计了两张互补的超图 + 两阶段检索,见图 2。

2.2 双超图索引

超图类型
粒度
超边含义
作用
Theme Hypergraph
跨 chunk
一条超边 = 一个主题(narrative outline)(由 LLM 自动摘要生成)
提供全局语义锚点,解决“主题漂移”
Entity Hypergraph
chunk 内
一条超边 = 多个实体的高阶关联(事件、因果、共现等)
提供局部细节证据,支持多跳推理
  • 构建流程

  1. 文档滑窗分段 → LLM 抽取主题描述 + 关键实体 → 主题超图
  2. 每段内部再抽取实体 + 低阶/高阶关系 → 实体超图(低阶=成对,高阶≥3 元组)
  • 存储
    两类超图分别序列化到向量+结构混合数据库,支持超边/顶点双路检索。

  • 2.3 认知两阶段检索

    阶段
    输入
    操作
    输出
    Stage-1 主题驱动
    用户 query
    用主题关键词匹配主题超边 → 扩散邻居顶点
    主题子图 + 初始主题答案 Atheme
    Stage-2 细节回溯
    Atheme + 实体关键词
    在实体超图里召回与主题对齐的实体顶点 → 扩散高阶超边
    实体子图 + 最终答案 A
    • 关键词自动抽取
      LLM 自动把 query 拆成“主题关键词”+“实体关键词”,无需人工规则。
    • 主题-实体对齐
      用 prompt 让 LLM 判断“哪些实体在主题答案里已被暗示”,避免召回无关实体,减少噪声。

    三、实验:5 个领域、6 个维度、5 种大模型全面碾压

    3.1 数据集与评测

    类型
    数据集
    特点
    跨域稀疏
    Mix
    61 篇多领域短文,语义连贯性最弱
    域内稀疏
    CS、Agriculture
    垂直领域但段落间关联弱
    域内稠密
    Neurology、Pathology
    医学教材,强主题演进

    评测指标

    • Selection-based:LLM 盲评两两对比,算胜率(6 维度 + 总体)
    • Score-based:GPT-4o 打分 0-100(6 维度)

    3.2 主要结果

    对比方法
    平均胜率(Overall)
    NaiveRAG
    15.5 %
    GraphRAG
    41.0 %
    LightRAG
    35.2 %
    HiRAG
    42.0 %
    Hyper-RAG
    46.8 %
    Cog-RAG84.5 %

    表1 节选:Cog-RAG 在 Mix 数据集上总体胜率 84.5%,领先第二名 Hyper-RAG **37.7%**。

    • 跨 LLM 稳健性:在 GPT-4o、Qwen-Plus、GLM-4-Air、DeepSeek-V3、LLaMA-3.3-70B 上均保持 ≥10% 绝对胜率提升
    • 医学密集领域最亮眼:Neurology 数据集比 Hyper-RAG 提升 **21.0%**,Pathology 提升 **26.4%**。

    3.3 消融实验

    表2  Score-based 消融:实体超图在跨域稀疏场景最敏感;主题超图在域内稠密场景贡献更大。

    3.4 可视化:一眼看懂高阶依赖

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询