微信扫码
添加专属顾问
结合知识图谱与大型语言模型,提升生物医学问答准确性的新框架。 核心内容: 1. 大型语言模型在生物医学领域的应用挑战 2. 知识图谱增强型框架KGT的开发与优势 3. KGT在药物重新定位和耐药性预测中的应用案例
Knowledge graph–based thought: a knowledge graph–enhanced LLM framework for pan-cancer question answering | GigaScience | Oxford Academic
背景:近年来,大型语言模型(LLMs)在各个领域表现出巨大潜力,特别是在生物医学科学中。然而,它们在实际应用中常常受到错误输出和幻觉式回应等问题的限制。
结果:本文开发了基于知识图谱的思考(KGT)框架,这是一种创新的解决方案,通过将LLMs与知识图谱(KGs)相结合,利用KGs中的可验证信息来改进它们的初步回应,从而显著减少推理中的事实错误。KGT框架展现出强大的适应性,并且在各种开源LLMs上表现良好。值得注意的是,知识图谱技术(KGT)可以通过潜在的药物与癌症关联发现现有药物的新用途,并通过分析相关生物标志物和遗传机制来协助预测耐药性。为了评估生物医学领域中的知识图谱问答任务,利用泛癌症知识图谱开发了泛癌症问答基准测试,命名为泛癌症问答。
结论:KGT框架显著提高了大型语言模型(LLMs)在生物医学领域的准确性和实用性。本研究作为概念验证,展示了其在生物医学问答方面的卓越表现。
● 引入了一个结合大型语言模型(LLMs)与知识图谱(KGs)的框架,以提高LLMs推理的事实准确性。
● 本系统是一个灵活的架构,能够无缝集成各种LLMs。
● 利用泛癌症知识图谱,提出了生物医学领域首个知识图谱问答基准。
● 案例研究表明,论文方法在解决药物重新定位、耐药研究、个性化治疗和生物标志物分析等生物医学挑战方面增强了LLMs的能力。
● 与现有方法相比,该方法表现优异。
https://academic.oup.com/gigascience/article/doi/10.1093/gigascience/giae082/7943459
https://github.com/yichun10/bioKGQA-KGT
研究问题:这篇文章要解决的问题是如何利用知识图谱(Knowledge Graphs, KGs)来增强大型语言模型(Large Language Models, LLMs)在生物医学领域的推理能力,特别是减少事实错误。
研究难点:LLMs在处理事实性错误时面临的主要挑战包括:缺乏上下文信息导致的问题理解困难、生成答案所需的知识不足、以及难以回忆具体事实。此外,细调技术虽然可以减少幻觉,但会带来巨大的训练成本,并且可能导致灾难性遗忘。
相关工作:已有的研究工作包括MedAlpaca、ChatDoctor、MedPaLM等方法,这些方法通过医学数据或文献进行细调。此外,还有Chain-of-thought(CoT)提示和自动提示工程师(APE)等方法通过提示工程来提升LLMs的性能。然而,这些方法在处理生物医学领域的复杂问题时仍存在局限性。
这篇论文提出了基于知识图谱的思想(Knowledge Graph-based Thought, KGT)框架,用于解决LLMs在生物医学领域的事实性错误问题。具体来说,
问题分析:首先,对输入的自然语言问题进行分解,提取关键信息,包括头实体名称、尾实体类型和尾实体的属性。
基于图模式的推理:构建一个基于知识图谱模式的无向图,并在该图上应用广度优先搜索(BFS)来识别连接头尾实体的最短路径。通过计算查询与每条路径的相似度,选择最优路径。
子图构建:根据最优路径生成查询语句,并在知识图谱中检索出相应的子图。
推理与输出:在子图上进行关系链和属性的推理,最终生成自然语言输出。
数据集:利用SmartQuerier Oncology Knowledge Graph(SOKG)的一个子图,构建了生物医学领域的知识图谱问答(KGQA)基准,称为pan-cancer question answering(PcQA)。PcQA包含405个数据条目,覆盖了广泛的生物医学研究领域。
评估标准:使用基于GPT-4、BERTScore和ROUGE的评估器来评估生成答案的准确性。
基线方法:为了评估KGT框架的优势,将其与几种直接应用于KGQA任务的方法进行比较,包括Base方法、CoT&ICL方法和KG-GPT方法。此外,还将KGT应用于Code-Llama-13B、ChatGPT-3.5和Taiyi等多种LLMs。
不同方法的比较:在基于Code-Llama-13B的实验中,KGT方法在所有评估指标上均优于其他方法。KG-GPT提高了F1评分15.7%,而KGT提高了33%。
不同LLMs的比较:KGT在Code-Llama-13B上的F1评分为86.8%,显著高于ChatGPT-3.5的Base方法(34.1%)、CoT&ICL方法(50.5%)和Taiyi的Base模型(19.5%)。
消融研究:通过消融研究分析了KGT框架的各个组件的贡献。结果表明,去除图模式推理(GSBI)会导致F1评分下降20%,去除问题和图模式推理(QA&GSBI)会导致F1评分下降8.6%,而去除所有组件(QA&GSBI&SC)会导致F1评分下降46%。
这篇论文提出了一种创新的KGT框架,通过将LLMs与知识图谱结合,显著提高了LLMs在生物医学领域的推理准确性和实用性。KGT框架无需细调,能够无缝集成多种LLMs,并在多个生物医学挑战中表现出色,如药物重新定位、耐药性研究、个性化治疗和生物标志物分析。通过案例研究,展示了KGT在实际应用中的潜力,为进一步研究和应用设定了新的标准。
创新框架:提出了知识图谱增强的大型语言模型(KGT)框架,通过将LLMs与知识图谱(KGs)结合,利用KGs中的可验证信息来提高LLMs的初始响应,显著减少了推理中的事实错误。
强大的适应性:KGT框架能够无缝集成各种开源LLMs,展示了其广泛的适用性和灵活性。
新的药物用途发现:KGT可以通过潜在的药物-癌症关联发现现有药物的新用途,并通过分析相关生物标志物和遗传机制来预测耐药性。
生物医学知识图谱问答基准:利用泛癌症知识图谱开发了第一个生物医学领域的知识图谱问答基准(PcQA),填补了该领域缺乏适当数据集的空白。
案例研究:案例研究表明,KGT方法在药物重新定位、耐药性研究、个性化治疗和生物标志物分析等生物医学挑战中增强了LLMs的能力。
无微调设计:KGT无需微调,通过提示工程和上下文学习即可提升LLMs的性能,具有即插即用的特点。
数据集范围:构建的问答数据集及其对应的SOKG子图主要为了验证KGT框架的有效性,其范围主要集中在验证方法上,可能无法覆盖所有潜在的应用场景。
模糊匹配缺失:系统目前不支持模糊匹配,如果药物名称拼写错误哪怕一个字母,系统将无法从知识图谱中检索到信息。未来计划改进这一方面,以提高系统的可用性和可靠性。
临床应用验证:尽管本研究展示了KGT框架的技术可行性和初步效果,但尚未在实际临床实践中进行验证。在任何临床或医疗决策中,应始终依赖专业医疗保健从业者的判断和指导。
问题1:KGT框架如何在生物医学领域减少LLMs的事实性错误?
KGT框架通过将大型语言模型(LLMs)与知识图谱(KGs)结合来减少事实性错误。具体来说,KGT框架的工作流程包括以下几个步骤:
问题分析:将用户输入的自然语言问题分解成更小的、更易管理的单元,并提取关键信息,包括头实体名称、尾实体类型和尾实体的属性。
图谱模式推理:基于知识图谱的模式,构建一个无向图,并在该图上应用广度优先搜索(BFS)来识别连接头尾实体的最短路径。通过计算查询与每条路径的相似度,选择最优路径。
子图构建:根据最优路径生成查询语句,并在知识图谱中检索出合理的子图。
推理与输出:在子图上进行关系链和属性数据的推理,最终生成自然语言输出。
通过这种方式,KGT框架利用知识图谱中的可靠信息来增强LLMs的推理能力,从而减少事实性错误。
问题2:KGT框架在处理多跳问题时是如何进行的?
KGT框架处理多跳问题的方法可以分为两种类型:
间接关系推理:通过检查头尾实体之间的间接关系(R1, R2),推断出它们之间可能存在的未知或潜在关系R
中间实体推理:通过跟随从头尾实体到中间实体M的路径,进一步推断出目标实体T。
在这两种情况下,KGT框架都利用广度优先搜索(BFS)在知识图谱中识别最短路径,并通过计算查询与每条路径的相似度,选择最优路径来进行推理。
问题3:KGT框架在实验中是如何评估其性能的?
KGT框架的性能通过以下几个方面进行评估:
数据集:利用SmartQuerier Oncology Knowledge Graph (SOKG)的子图,创建了一个名为pan-cancer question answering (PcQA)的生物医学知识图谱问答基准数据集。PcQA包括405个数据条目,覆盖了广泛的生物医学研究领域。
评估标准:使用基于GPT-4、BERTScore和ROUGE的评估器来评估生成答案的准确性。具体来说,GPT-4评估器基于句子间的意义相似度打分,BERTScore评估器使用上下文敏感的嵌入来评估语义相似度,ROUGE评估器则评估生成文本与参考文本的最长公共子序列(LCS),重点考察序列的相似性和语义内容的保留。
基线方法:为了评估KGT框架的优势,将其与几种直接应用于KGQA任务的方法进行比较,包括Base方法、CoT&ICL方法和KG-GPT方法。所有方法均基于Code-Llama-13B模型。
对比分析:将KGT框架应用于Code-Llama-13B、ChatGPT-3.5和Taiyi模型,进行跨不同LLMs平台的对比分析。实验结果表明,KGT框架在Code-Llama-13B模型上的F1得分为86.8%,显著高于ChatGPT-3.5的Base方法(50.5%)和Taiyi的Base模型(19.5%)。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-07-02
企业级知识图谱的实体架构治理实践
2026-07-02
一文讲清:“统一语义”、“构建本体”、“AI推理”这三者的关系
2026-07-02
graphify + claude 图谱关系
2026-07-01
把运维能力装进 Qoder,一句话就能定位根因
2026-07-01
Gbrain、GraphRAG、LLM Wiki、Graphify:4 种知识图谱方案怎么选
2026-07-01
一文讲清:本体(Ontology)与语义(Semantics)到底是什么关系?
2026-06-30
从 OOP 到本体:用形式语义支撑 AI 协作方法论
2026-06-29
从“领域描述”到“本体”——AI时代的系统设计模式探讨
2026-04-07
2026-04-19
2026-04-23
2026-04-22
2026-06-03
2026-04-23
2026-05-26
2026-05-07
2026-05-28
2026-05-23
欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。
在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。
一、 定义
本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。
会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。
知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。
二、 账号注册与登录
登录方式:本网站支持以下登录方式,您可根据实际情况选择:
微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。
手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。
账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。
实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。
未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。
三、 服务内容与规范
知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。
服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。
禁止行为:您在使用服务时不得实施以下行为:
利用技术手段批量爬取、下载、转存知识库内容;
将知识库内容用于商业目的或未经授权地向第三方传播;
干扰本网站正常运行或侵犯其他用户合法权益;
发布违法违规信息或从事违反公序良俗的活动。
四、 知识产权声明
权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。
有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。
侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。
五、 个人信息保护
我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。
您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。
您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。
六、 免责声明
内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。
不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。
第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。
七、 违约责任
如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。
如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。
八、 法律适用与争议解决
本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。
因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。
九、 其他
本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。
本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。
我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。