2026年7月9日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

一位海外开发者的 OpenSPG KAG 实践分享

发布日期:2025-01-03 18:00:13 浏览次数: 4098
作者:SPG知识图谱

微信搜一搜,关注“SPG知识图谱”


人工智能发展浪潮下,知识增强生成模型(KAG)已成为一个重要的技术前沿。作为知识图谱研究爱好者,我认为蚂蚁 OpenSPG 的最新 KAG 展现出很强的创造力,其能够改变生成模型与专业上下文数据之间的互动,特别是逻辑推理和自然语言响应处理技术中的标准被 OpenSPG-KAG 推向一个新的高度。

1

什么是 KAG?

KAG 是一个以创建和操作知识图谱为核心的框架。知识图谱是数据之间相互关联的可视化和结构化表示,对于搜索引擎、推荐系统和机器学习等应用至关重要。KAG 的目标是提供一个强大的平台,使开发者能够:

  • 轻松构建图谱;

  • 通过增强算法丰富数据;

  • 集成人工智能,以进行更精确的推理。

通过理解 KAG,可以明显看出,这个框架旨在帮助从初学者到专业开发者,在项目中创造更优的解决方案。它在简便性和集成方面的优势,使其成为下一代基于数据的应用程序的前景工具。

关键特性

Features

开放标准兼容性:KAG 基于开放标准,便于与 Neo4j 和 GraphQL 等工具的互操作性。这使得开发者能够无缝地将 KAG 集成到现有的技术生态系统中。

可扩展性KAG 旨在处理从小型数据集到企业级图谱的各种规模,确保无论项目的大小如何,都能提供最佳性能。

原生 AI 集成:支持先进的语言模型,使得图谱中的节点能够通过推理来丰富信息。这简化了诸如在大数据量中识别隐藏模式等复杂任务。

易于使用:提供直观的 API 和结构良好的文档,使得即使是初学者也能轻松上手。其设计的清晰性确保了高效且无障碍的工作流。

多语言支持:KAG 支持英语和普通话,定位为一个真正全球化的工具,连接来自不同地区的开发者。

2

使用 OpenSPG-KAG 的经验

自从开始使用 OpenSPG-KAG 以来,我对很多方面感到惊讶。首先是我能够快速设置一个基础图谱。文档显然是为了简化学习过程,提供了切实可行的示例,直截了当。

我特别强调的一点是与语言模型的集成能力。这让我能够自动生成看似无关的数据之间的关系,而在其他系统如 RAG(检索增强生成)中,这通常更加僵化或需要更多的预配置。此外,KAG 执行复杂操作的速度也很快,这为用户提供了流畅而令人满意的体验。

然而,我注意到一些内部工具,如数据可视化工具,如果使用更现代的界面效果应该会更好。尽管它们是可用的,但与一些成熟的专门用于可视化图谱的工具相比,它们显得有些原始。此外,在将 KAG 与海外现有解决方案集成时,遇到了一些挑战,这可能是未来版本需要改进的地方。

另一个显著的优势是 KAG 提供的定制化程度。从节点配置到关系处理方式,这个框架提供了详细的控制,这在类似产品中是少见的。当我与其他 RAG 方法进行比较时,KAG 凭借更深层次的数据处理脱颖而出,而许多 RAG 则仅仅优先考虑快速的信息检索。

第一步是通过 Docker Compose 安装 KAG,这大大简化了过程。Docker Compose 使得服务和容器的管理变得高效,非常适合测试或开发项目。借助这个工具,整个安装过程只需要几个命令,而无需进行复杂的手动配置。

这种方法还让我确保测试环境是可复制和模块化的,便于未来对系统进行修改或更新。

get docker-compose.yaml file

curl -sSL https://raw.githubusercontent.com/OpenSPG/openspg/refs/heads/master/dev/release/docker-compose.yml -o docker-compose.yml

docker compose -f docker-compose.yml up -d


在环境配置完成后,我通过地址 http://127.0.0.1:8887 访问了 KAG 的图形界面。这个界面作为管理和自定义系统所有方面的中心点。

进入后,我找到了设置系统的主要选项,如创建新的知识库。从这里开始了更详细的配置过程。

在继续创建知识库之前,定义两个关键组件是至关重要的:

我决定使用 llama3.2 3b,这是一个紧凑高效的模型,适用于资源有限的环境或像这样的测试项目。尽管存在更先进的模型,我选择了这个,因为它在性能和易用性之间取得了良好的平衡。

ollama run llama3.2

对于嵌入,我选择了 bge-m3,因为它因其高精度和与 KAG 的兼容性而被高度推荐。该模型保证了对加载到系统中的内容进行高质量的向量表示,从而提高了在问答任务中的信息检索能力。

ollama run bge-m3

作为此步骤的一部分,我还在 Docker 中安装了 Ollama 和 KAG。这为系统增加了灵活性,使我能够管理额外的模型并在一个环境中进行不同配置的实验。

一旦定义了主要组件,我开始创建和配置我的第一个知识库。这个知识库作为主存储库,用于存储处理过的数据和系统生成的向量表示。

KAG 的界面让我能够为知识库命名、定义初始参数并连接之前选择的模型。这个步骤对系统开始处理我计划加载的信息至关重要。


为了测试系统的功能,我上传了一个与医学相关的简单 PDF 文件。这个文件作为训练和评估 KAG 在实际任务中表现的基础材料。

在这个步骤中,系统处理了文件内容,从文本中生成了嵌入。这样,PDF 中的信息就完全被索引并准备好供后续查询。

配置完成后,我进入了 KAG 的问答部分。这个功能允许直接与知识库互动,根据加载的数据获取特定的答案。

为了测试系统,我提出了一个关于 PDF 医学内容的简单问题。KAG 通过生成一个概念图来回答,不仅包含了答案,还可视化了文本中关键思想之间的联系。

这个初步结果令人满意,确认了初始配置和所选模型都按预期工作。

完成这个基础测试后,我发现了几个扩展 KAG 使用的机会:

  • 使用更复杂和多样化的数据进行测试,如数据库或多个文档。

  • 尝试其他语言模型和嵌入,比较结果。

  •  探索将 KAG 与外部工具集成,以自动化工作流。

3

评估与比较

蚂蚁集团知识图谱团队对 HotpotQA 和 2WikiMultiHopQA 等数据集的测试中,KAG 在 F1 分数等指标上表现出显著的改进(在某些情况下提升了高达 33.5%)。与 HippoRAG 等其他方法相比,KAG 在电子政务和电子健康等实际应用中提供了质的飞跃。从我的角度来看,将逻辑推理和语义集成到复杂系统中的能力是其关键差异化优势。

KAG 所采用的多步检索方法在应用于不同数据集时,证明其优于单步检索方法。这凸显了其在分析和建立文档之间的有意义连接方面的先进能力,使其能够更深入、更精确地推理现有信息。

在我的经验中,许多基于 RAG 的工具在适应高专业化领域时存在困难,在这些领域,上下文细节至关重要。KAG 不仅解决了这个问题,还通过应用逻辑规则和基于图谱的推理将其转化为竞争优势。

GraphRAG:KAG 采用了一种强大的结构化信息检索方法(例如,数据库、表格、文档),该方法直接与生成模型集成。相比之下,GraphRAG 专注于知识图谱,虽然它对复杂关系很有用,但管理起来可能更加困难,并且没有 KAG 那样直接和清晰的集成方式。此外,KAG 在外部知识源的灵活性方面表现更好,因为它不限于图谱结构。它可以处理多种数据源,而 GraphRAG 则仅限于图谱领域,这可能不适用于某些类型的应用。

HippoRAG:虽然 HippoRAG 在改善长期记忆方面表现出色,KAG 通过持续地将外部知识集成到生成回答中,进一步提升了这一能力。HippoRAG 适用于长时间对话,但 KAG 通过结合不断流入的上下文数据与强大的知识库,能够更有效地生成回答。

NativeRAG:这种方法更为直接,通过整合信息检索和生成过程,避免了复杂的中间步骤,从而提高了效率。然而,这可能会限制其在处理复杂情况时的精确度和能力。相比之下,KAG 更为复杂地处理结构化知识的集成,这使得它在精确度和灵活性上表现得更好,尽管它的复杂度略高。

LightRAG:旨在轻量化和提高速度,适用于优先考虑速度且资源有限的应用。然而,在基于深入精确知识的生成质量和精度方面,KAG 更为优越。LightRAG 为了提高效率,牺牲了一部分质量,而 KAG 在不大幅牺牲速度的情况下,保持了较高的精度和上下文理解。

KAG:KAG 被定位为生成精确且具有上下文相关性的文本的最强大选项,这得益于其有效整合外部知识源的能力。与 GraphRAG、HippoRAG、NativeRAG 和 LightRAG 等模型不同,这些模型在效率、复杂关系或记忆等方面具有优势,KAG 则凭借其处理多样化和结构化知识的能力脱颖而出,提供更精确且具有丰富上下文的回答。其对外部数据集成的重视不仅提高了精度,还在多种应用中提供了更高的灵活性,使其成为与其他专门化模型相比,更全面且适应性强的解决方案。

4

批判性思考

从用户和开发者的角度来看,我认为 KAG 算法创造力与结构化知识的协同,是对多种行业的适应性以及对上下文相关性的重视,使其在面对更为通用的替代方案时具有竞争优势。然而,这不仅仅是技术上的优势,更是对技术与实际应用之间关系的重新定义。

在一个精确度和相关性至关重要的生态系统中,KAG 被定位为推动人工智能在传统上对这些技术持保留态度的行业中的应用的催化剂。它的发展仍在继续,我会持续关注,不仅因为它的技术影响,还因为它改变工业范式的能力。

此外,我认为 OpenSPG 的 KAG 的影响力不会仅限于其在企业中的应用。开源代码和模块化的设计可能会激发新一代协作工具的出现,惠及独立用户和各行各业。这突显了在研究和开发中持续领导的重要性,特别是在人工智能进展具有深远社会和伦理意义的当下。

5

未来展望

展望未来,KAG 有机会巩固其作为一个更加多功能和易于访问的框架的地位。有几个关键领域,KAG 的开发可以继续加强。

简化实施过程最重要的期望之一是创建工具和指南,以减少初始配置的复杂性。这将有助于中小型企业的采用,尤其是那些没有专业技术团队,但需要类似 OpenSPG KAG 提供的功能的企业。

优化逻辑推理KAG 可以进行对话任务和处理自然语言回答的过程,能够更好地进行推理并提供更具逻辑性的回答。

作为一名海外开发者,使用中国本土的工具 KAG 是一次具有启发性的体验。这个框架不仅体现了中国的技术进步,还展示了其融入全球软件领域的承诺。尽管仍有一些需要改进的地方,例如某些内部工具的用户界面,KAG 具有成为知识图谱领域标杆的巨大潜力。

与其他 RAG 方法相比,KAG 凭借其从构建到高级数据推理的全面方法脱颖而出。它处理大规模信息的能力以及多语言支持使其成为该领域的革命性工具。

随着社区的不断发展和对创新的持续关注,KAG 有望挑战当前知识建模领域的局限性。如果你正在寻找一个结合了简洁性、可扩展性和人工智能的现代框架,我鼓励你尝试 KAG。谁知道呢!也许你会发现一款能改变你在项目中处理数据方式的工具。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅