微信扫码
添加专属顾问
RAG帮你找到资料,但Ontology为Agent构建完整的业务世界,让AI真正理解企业运作逻辑。 核心内容: 1. RAG在企业AI应用中的局限性分析 2. Ontology如何定义Agent的业务对象与关系 3. 从文档检索到业务参与的Agent升级路径
如果一个企业 AI 项目已经做过 RAG,大概率会遇到一个很尴尬的问题。
一开始,效果看起来不错。
员工问制度,能答。
售后团队问知识库,能答。
销售问产品资料,能答。
但只要业务方继续往前推一步,问题就变了。
他不再问“这份资料里写了什么”,而是问:
这时候你会发现,RAG 能帮模型找到资料,但它没有天然告诉模型:
所以这篇文章先把一句话说清楚:
RAG 是 Agent 的资料检索层。Ontology 才是 Agent 的业务世界。
RAG 解决的是:模型应该看到哪些上下文。
Ontology 解决的是:企业里到底有哪些对象、关系、状态、动作、权限和业务逻辑。
如果没有这个业务世界,Agent 再会说话,也只能在文档片段里猜。
先把这个词说清楚。
Ontology,中文常见翻译是 本体,也有人译成 本体论。
在哲学里,本体论讨论的是“世界上到底存在什么”。换句话说,它关心的不是某个句子怎么表达,而是一个世界里有哪些东西、这些东西是什么、彼此之间是什么关系。
到了 AI 和知识工程里,这个词变得更工程化。
Tom Gruber 对 ontology 有一个经典定义:它是对某个概念化的显式规格。用工程语言说,就是把一个领域里默认存在的对象、概念、关系和约束,用机器和人都能对齐的方式写清楚。
W3C 的 OWL,也就是 Web Ontology Language,做的也是类似的事:用来表示事物、事物集合,以及它们之间的关系。
所以,放到企业 Agent 里,Ontology 不应该被理解成一个玄学词。
它更像是 Agent 的 业务世界说明书。
这也是为什么最近国内外做 Agent、GraphRAG、Agent Memory、企业知识层的人,都重新开始讨论 ontology。
原因并不复杂:
所以这几年你会看到很多相关方向变热:GraphRAG、Knowledge Graph、Agent Memory、Ontology-driven RAG、AI agent world model。
它们背后都在回答同一个问题:
Agent 不能只读文本,它要有一个可查询、可约束、可更新的业务世界。
这里就回到了本体论最有价值的地方。
本体论听起来像哲学课,但它对架构师真正有用的地方很朴素:
它不是先问“系统怎么实现”,而是先问“这个系统承认哪些东西存在”。
如果一个 Agent 的世界里只有文档,那它最多只能围绕文档说话。
如果一个 Agent 的世界里有客户、设备、合同、订单、工单、库存、审批、状态和动作,它才有机会进入业务流程。
哲学问题到了工程现场,会变成下面这张表:
所以不要把本体论理解成“讲概念”。
放到企业 Agent 里,它关心的是一件非常现实的事:
业务世界怎样被机器看见、被模型理解、被系统约束、被人类回放。
这也是为什么国内外这条线都在升温,只是叫法不同。
国内很多时候不会直接说 Ontology,而是说 知识增强、知识图谱、企业知识库、Agent 平台、数据智能。
百度是这条路线里很典型的例子。
早在 ERNIE 3.0 的论文里,百度就把方向写成 Large-scale Knowledge Enhanced Pre-training。论文里明确说,传统大模型主要从 plain text 训练,没有显式引入 linguistic knowledge 和 world knowledge;ERNIE 3.0 则在 plain text 之外,引入 large-scale knowledge graph 做预训练。
这不是 Palantir 意义上的企业 Ontology。
但它说明百度长期在押一个判断:模型不能只吃文本,知识结构也要进入 AI 系统。
到现在的百度千帆,它的官方文档已经把平台定位成“以 Agent 为核心”的企业级服务,围绕 Agent 引擎、工具及 MCP、模型服务、企业级服务来做应用落地;Agent 引擎里也出现了自主规划、工作流、多智能体协同这些模式。再看 EICopilot 这类研究,已经把 LLM-driven agents 和大规模企业知识图谱放在一起,用自然语言查询、生成 Gremlin、探索企业关系。
这条国内路线,大致是这样走的:
国外更典型的代表是 Palantir。
Palantir 的说法更直接:它把 Ontology 放在 Foundry 和 AIP 的核心位置,不只把它当成知识图谱,而是当成企业的 operational layer。
AIP 的官方文档也很明确:AIP Logic、AIP Chatbot Studio、AIP Evals 这些工具,是在 Ontology 和开发工具链之上构建 production-ready 的 AI workflows、agents 和 functions。AIP 架构文档里还把 Ontology 描述成把 data、logic、action、security 统一到企业决策表示里的系统,并且强调它要建模 operational processes 里的 nouns 和 verbs。
这个区别很关键。
这三条线不完全相同。
不能把百度的知识增强,直接等同于 Palantir 的 Ontology。
也不能把开源 GraphRAG,直接等同于企业操作层。
但它们指向同一个趋势:
企业 Agent 的竞争,不会只停在模型层,而会进入业务世界层。
很多人一听 Ontology,会马上想到知识图谱。
这个理解不算错,但放到企业 Agent 里,太窄。
如果只是把文档里的实体和关系抽出来,画成一张图,那更接近 Knowledge Graph 或 GraphRAG。它对检索有帮助,但还没有进入企业 Agent 的核心。
企业 Agent 需要的 Ontology,至少不是一张“概念关系图”。
它更像一套业务操作模型。
Palantir 的官方文档里,对 Ontology 的描述很直接。
它不是把 Ontology 说成“知识图谱”,而是说它是组织的 operational layer。它把企业已经接入的平台数据、虚拟表、模型等数字资产,连接到现实世界里的对象,比如工厂、设备、产品、客户订单、金融交易。
更关键的是,Palantir 把 Ontology 拆成两类元素:
这组词很重要。
语义层只是 nouns,也就是名词:客户、订单、设备、合同、工单、库存。
但企业 Agent 真正进入生产,必须看到 verbs,也就是动词:创建工单、升级优先级、调整交期、冻结合同、提交审批、触发补货。
只有名词,没有动词,Agent 只能解释业务。
名词和动词都在受控模型里,Agent 才可能参与业务。
RAG 很有价值。
这点不要误解。
没有 RAG,企业 AI 很难接触私有知识、产品文档、制度、历史案例、交付资料和行业语料。RAG 是很多企业 AI 的第一块地基。
但 RAG 的核心动作仍然是检索。
它通常回答的是:
这对知识问答足够。
但企业 Agent 的问题不是“能不能找到资料”。
它的问题是:
这就是很多企业 RAG 项目从 Demo 到生产时变形的原因。
Demo 阶段,用户问一句,模型答一句。只要回答像样,就觉得可以上线。
生产阶段,用户会要求它接系统、读状态、做判断、推流程、留记录。
这时,RAG 不会消失,但它会变成一个局部能力。
它负责知识和证据。
Ontology 负责业务世界。
Harness 负责运行控制。
Evals 和 Observability 负责验收和改进。
把这些东西都塞给 RAG,是架构上偷懒。
沿用上一篇的机械制造售后场景。
客户可能说:
我们希望售后工单处理更智能一点,最好能根据设备状态和历史维修记录,自动给出处理建议。
如果只按 RAG 做,团队很容易做成这样:
这当然有用。
但它还不是企业 Agent。
因为真正的售后问题不是一段故障描述,而是一组业务对象正在变化。
RAG 可以告诉模型“这类故障一般怎么处理”。
Ontology 要告诉 Agent:
这就是 RAG 和 Ontology 的区别。
RAG 帮 Agent 读资料。
Ontology 让 Agent 认对象。
RAG 给上下文。
Ontology 给业务结构。
RAG 让回答更有依据。
Ontology 让动作有边界。
这里也要避免另一个误区。
不是一说 Ontology,就要把全公司数据建成一张宏大的知识图谱。
那会把项目拖死。
企业 Agent 的 Ontology,应该从一个具体业务流开始。
比如售后工单,不需要一开始建完整企业模型。可以先建一条窄链路:
这已经足够支撑一个有限但可运行的 Agent。
架构师真正要问的不是“我们有没有企业级大 Ontology”。
而是:
如果这些问题没回答,所谓 Agent 其实只是在知识库外面包了一层对话。
它可以回答。
但它不能可靠地做事。
现在开源生态里,GraphRAG 很热。
这不是偶然。
因为大家已经发现,只靠向量相似度,很难处理复杂关系。
Microsoft 的 GraphRAG 项目,把自己描述成一套从非结构化文本中抽取有意义结构化数据的 pipeline 和 transformation suite,用 knowledge graph memory structures 增强 LLM 输出。它的 README 也提醒,GraphRAG indexing 可能很贵,要从小开始,还需要 prompt tuning。
Neo4j 的 GraphRAG Python 包,则把图检索、向量检索、图遍历、Text2Cypher 等能力放到 RAG 应用里。
LangChain 和 Neo4j 的文章也说得很清楚:图擅长表达异构、互联的信息;向量数据库擅长处理非结构化文本。更好的做法不是二选一,而是把结构化图数据和向量检索结合起来。
这些趋势说明了一件事:
RAG 正在从“找相似文本”走向“找结构化上下文”。
但 GraphRAG 仍然不是企业 Ontology。
二者的区别可以这样看:
GraphRAG 可以成为 Ontology 的一部分,或者成为 Ontology 之外的检索增强层。
但不要把它们混成一个词。
GraphRAG 让 Agent 更会找关系。
Ontology 让 Agent 处在一个可治理的业务世界里。
企业 Agent 的上下文,不能只有文档片段。
至少要有五类结构。
把这五类结构写出来,Agent 的架构才会清楚。
否则你会在实现阶段不断临时补洞。
这些补丁短期能跑,长期会变成维护灾难。
因为业务结构没有被工程化,只是被 prompt、代码分支和人工兜底散落在系统里。
Ontology 的价值,是把这些结构显式化。
让 Agent 不靠猜。
让工程师不靠补丁。
让业务方知道系统到底按什么世界模型运行。
还有一个问题,在企业里很容易被低估。
对象关系不是永远不变的。
客户等级会变。
合同条款会变。
设备状态会变。
经销商服务能力会变。
库存会变。
组织权限会变。
如果 Agent 只拿到一段旧文档,它很难判断“现在是否仍然成立”。
这也是为什么一些开源 Agent memory 项目开始往 temporal graph 方向走。
Graphiti 的 README 里把自己描述成给 AI agents 用的 temporal context graph engine。它强调 facts change over time,保留 provenance,支持 prescribed and learned ontology,还能把用户交互、结构化和非结构化企业数据、外部信息持续整合进一个可查询的 graph。
这对企业 Agent 很关键。
因为 Agent 不是做一次性问答。
Agent 会在持续变化的业务环境里运行。
所以企业 Ontology 不只是“对象表”。
它还要回答:
没有这些,Agent 就会用过期世界做当前决策。
这比回答错一段知识更危险。
上一篇讲 SDD。
SDD 不是文档装饰,而是 Agent 的可执行规格。
那 Ontology 怎么接 SDD?
很简单:从 SDD 里抽对象。
比如 SDD 里有一句:
售后主管在工单后台查看高风险设备故障。Agent 读取设备遥测、历史维修、服务合同、备件库存和经销商服务能力,判断是否建议升级工单、请求备件或派发现场服务。高价值客户和合同例外必须人工确认,所有建议、采纳和修改写入审计记录。
这句话不是直接丢给模型。
它应该拆成下面这些东西:
这就是 SDD 到 Ontology 的转译。
SDD 负责把业务需求写到可执行。
Ontology 负责把可执行规格变成 Agent 可以读取、判断和调用的对象世界。
如果这一步跳过,后面所有框架都会变得很尴尬。
所以,Ontology 不应该等平台建设后期再补。
它应该从第一份 SDD 里长出来。
不是所有企业 AI 场景都需要完整 Ontology。
如果只是制度问答、文档检索、材料总结,RAG 可能已经足够。
真正的问题是,不要把 RAG 场景包装成 Agent 项目。
可以用下面这张表判断。
如果右侧特征占多数,就不要再纠结“RAG 怎么调得更准”。
先把对象层建起来。
否则你会在错误的层上反复优化。
这篇不是建议企业先搞一个宏大的 Ontology 项目。
相反,第一版应该很小。
从一个 Agent 场景开始,按下面顺序做。
这不是多写文档。
这是在给 Agent 建运行环境。
如果团队已经有数据仓库、主数据、权限系统、流程引擎和业务系统,也不用全部推翻。
Ontology 可以先是一个薄层:
你不一定要一次建成一个大平台。
但必须先有对象层意识。
没有对象层,Agent 架构会一直退回聊天框。
RAG 是必要的。
但 RAG 不是企业 Agent 的架构终点。
如果一个 Agent 只是回答文档问题,它可以停在 RAG。
如果一个 Agent 要进入业务流程,它必须理解业务对象。
如果一个 Agent 要触发动作,它必须受到状态、权限、策略和审计约束。
所以,企业 AI 的下一层不是“更大的知识库”,而是更清楚的业务世界。
换成架构语言:
把 RAG 当全部,企业 AI 会停在知识助手。
把 Ontology 建起来,Agent 才开始拥有业务世界。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-30
本体论语义建设新思路,另类RAG来解决检索问题
2026-06-29
PixelRAG:伯克利团队颠覆传统 RAG,用截图代替文本检索! 28 天狂揽 3000+ Star!
2026-06-29
腾讯WeKnora开源详解(三):检索引擎与生态集成
2026-06-29
腾讯开源WeKnora详解(二):知识库与对话核心能力
2026-06-29
RAG又被绕开了,MIT用MEMO给AI外挂记忆脑
2026-06-25
5.2k星星爆火开源!你的知识库迎来了史诗级更新,「像素级原生搜索」来了
2026-06-25
1.5K Star!网页提取神器 webclaw:让 AI 精准抓取网页核心内容!
2026-06-25
聊一聊检索即推理:基于LLM-Wiki的自演化智能体原生检索
2026-04-06
2026-04-27
2026-04-23
2026-04-02
2026-04-20
2026-04-09
2026-04-12
2026-04-22
2026-04-10
2026-05-14
2026-06-23
2026-06-23
2026-06-15
2026-06-10
2026-06-10
2026-05-20
2026-05-18
2026-05-11
欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。
在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。
一、 定义
本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。
会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。
知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。
二、 账号注册与登录
登录方式:本网站支持以下登录方式,您可根据实际情况选择:
微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。
手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。
账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。
实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。
未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。
三、 服务内容与规范
知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。
服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。
禁止行为:您在使用服务时不得实施以下行为:
利用技术手段批量爬取、下载、转存知识库内容;
将知识库内容用于商业目的或未经授权地向第三方传播;
干扰本网站正常运行或侵犯其他用户合法权益;
发布违法违规信息或从事违反公序良俗的活动。
四、 知识产权声明
权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。
有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。
侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。
五、 个人信息保护
我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。
您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。
您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。
六、 免责声明
内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。
不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。
第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。
七、 违约责任
如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。
如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。
八、 法律适用与争议解决
本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。
因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。
九、 其他
本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。
本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。
我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。