2026年4月10日 周五晚上19:30,来了解“从个人单点提效,到构建企业AI生产力”(限30人)
免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

中台已死,语义层将重塑数据架构|爱分析访谈

发布日期:2026-04-08 08:11:06 浏览次数: 1531
作者:爱分析ifenxi

微信搜一搜,关注“爱分析ifenxi”

推荐语

语义层正成为AI时代数据架构的核心,让AI真正理解并操作数据,推动Agent应用从Demo走向生产级落地。

核心内容:
1. 语义层技术架构的崛起与全球数据巨头的布局
2. 语义层如何解决AI理解数据的关键问题
3. Aloudata在语义层领域的创新实践与市场洞察

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
语义层正成为AI-Ready数据平台的核心技术架构,并被全球数据巨头Palantir、Databricks所关注和布局。
2025年Palantir市值不断攀升,Ontology本体技术备受瞩目,而Ontology技术主要是用于解决语义层问题。
2025年9月,全球数据平台巨头Snowflake联合 Salesforce、dbt Labs、BlackRock 等发起Open Semantic Interchange(OSI)规范,后面另一家数据平台巨头Databricks也加入。2026年初几家数据平台巨头开源了OSI规范,旨在为Agent应用落地打造一套中立开源的语义层标准。
语义层的价值是让AI真正理解数据,并将决策转化成行动,这是Agent应用从Demo走向生产级落地的关键,是面向AI应用的数据基础设施的必备条件。
成立于2021年的数据基础设施厂商Aloudata,专注于以NoETL语义编织架构变革传统数据架构,核心产品包括逻辑数据编织平台Aloudata AIR、主动元数据平台Aloudata BIG、自动化指标平台Aloudata CAN、分析决策智能体Aloudata Agent。
基于数据编织和语义编织,Aloudata可以帮助企业用户构建面向Agent应用的语义层,构建AI可理解、可操作的数据底座。
Aloudata创始人兼CEO周卫林拥有20余年大数据领域经验,曾任蚂蚁集团数据平台部总经理。近期,爱分析对周卫林进行访谈,探讨语义层市场机会、Agent对数据基础设施的影响、AI数据厂商核心壁垒等话题。

核心观点

  • 语义层将成为企业决策中枢。
语义本质是业务口径定义,核心组件包括数据虚拟化引擎和语义引擎,最终需涵盖决策到行动全链路,支持Action API,形成闭环。
  • 语义层与数据中台是不同理念的技术架构。
数据平台操作将从以人为主转向以AI为主,大部分是由AI完成数据平台相关操作,面向人的BI看板等功能需求将大幅减少。
  • 数据基础设施的商业模式将迎来变革。
中国市场以私有云为主导,不太可能完全按照Token定价,应该会以“软件+订阅+调用量”组合为主要商业模式。
  • 数据厂商核心竞争力在于管数据。
数据厂商的关键价值是将企业隐性信息低成本显性化为AI可用知识,而不是开发数据平台的功能或者维护整个数据平台系统。
以下为本次访谈实录,在不改变原意基础上略有修改。

01

OSI标准是个信号,语义层价值初现
爱分析:关于OSI标准,我看您之前认为它是一个重要的历史性时间节点。对比OSI和SQL,您觉得OSI会对整个数据基础设施产生哪些影响?
周卫林:SQL诞生背景大家应该都理解。当时七十年代集成电路快速发展,计算机开始进入企业,全球化带来刚性的信息化需求,数据处理离不开数据库。IBM的研究员提出了关系模型,并在此基础上设计了SQL。
早期各家厂商各自实现,语法互不兼容,用户移植成本极高,加上政府采购也要求有标准可依,才推动了1986年ANSI、1987年ISO先后发布SQL标准。它解决的是科技跃迁期应用爆发、交互成本高、技术落地难的问题。
现在OSI则是AI大模型尤其是Agent起来后的现象。如果每家企业都定义不同的语义,上层BI、Agent应用和数据库之间适配就会很麻烦。所以大家开始思考怎么标准化。SQL解决的是数据可访问和访问效率的问题,OSI则是在SQL之上解决数据可理解和可行动的问题。
以前数据操作是数据分析师和程序员的事,现在 AI Agent需要理解业务语义才能行动,语义必须标准化。OSI没有颠覆SQL,而是在其基础上延续。
但难度不一样,SQL有完备的关系代数做理论支撑,语法细致、成熟;OSI目前只是一个很粗的语法文件,没有类似数学证明,只定义了信息结构,没定义完整语法表达,还处于很早期的阶段。
未来OSI有没有可能像SQL一样,把语法规范化,同时保留厂商扩展性。如果能走到那一步,才算真正产业落地。现在它还只是个信号,表明大家看到了AI技术跃迁带来的新需求,但距离SQL那样的成熟标准还有差距。
爱分析:所以OSI更多是一个方向信号,还不是完整的指引,目前只是起步阶段?
周卫林:对,它还没到提一个标准,大家适配就行、各自实现差异化的阶段。如果真走到那一步,今天聊的很多话题都会不一样。但能不能走过去,现在还不好说。SQL语法明确、规则严谨、完备性强,OSI能不能达到那个成熟度,厂商愿不愿意在语法层面真正开放,到时候再看。

02

数据中台将被淘汰,语义层会重塑数据架构
爱分析:您之前提到从“数仓+BI”的传统架构变成了“数据湖 + 语义 + 消费”三层架构,语义层原先要么放在数仓里,要么在BI中,现在语义单独作为一层,这一层未来会包含哪些核心组件和功能?它的形态又会是什么样子?
周卫林:你刚才提到的,原来的语义到底在哪里,其实我一直把它理解为一个连续的加工链。语义的本质就是业务口径的含义,这个口径本来就是一个连续段。比如在数仓明细层定义有效订单,到了BI里又定义高价值客户的订单量,它其实是连续口径的叠加和计算。所以很难严格说语义到底全在数仓,还是全在BI。
我们理解,数仓里为了数据清洗所做的那些工作,如脏数据剥离、错数据修正、缺失数据补齐等,这部分还是保留在数仓的清洗层。清洗之后,面向业务场景的指标定义、口径定义以及后续的叠加计算,这些都属于语义层应该管的内容。
因此,严格来说,语义层大概率不会去做数据清洗,但会负责转换这一层。
如果这么看,语义层应该包含几个核心东西:
第一,因为企业环境多样,语义层必须有数据连接能力,能连到不同的数据源和数据集,而且一定是虚拟化连接,不能把所有东西都塞到一个统一的技术栈里。
第二,由于企业内部计算资源很难收敛,语义引擎里必须有一个数据虚拟化模块,来复用已有的存储和计算资源。所以数据虚拟化引擎是绕不开的。
第三,就是基于数据去定义口径和架构逻辑的语义化过程。
所以整体来看,语义层有两个大的引擎:一个是数据虚拟化引擎,一个是数据语义引擎。语义引擎要负责语义的定义、执行和服务,还要对外暴露语义API和CLI接口,方便AI友好调用。同时还要做版本管理、权限管理、路由管理等。
从未来形态来看,其实加工过程和应用过程很难完全割裂。数据分析产生决策,决策又产生行动,这中间有很多连续的判断。行动那一步可能在业务系统执行,但之前的决策过程往往都属于数据分析。
因此,语义层未来一定会延伸到行动决策环节,会把支持行动所需的信息面都纳入进来,包括业务系统的Action API。只有这样才能形成闭环,否则上层应用就不知道去哪里拿统一的业务知识。
所以我认为,语义层最终会成为支持从决策到行动的平台,成为企业真正的决策中枢。
爱分析:那有了语义层之后,企业原来建设的数据资产平台是不是就不需要了?语义层是不是更像数据虚拟化,主要是一个逻辑层,底层存储还是要放在数据湖或多模态数据平台上?
周卫林:肯定需要底层存储和数据平台的。语义层更多是定义态的东西,真正要存储和执行,还是要依赖数据库、图计算、流计算等企业已有的计算资源。
爱分析:从企业用户构建能力角度,语义层是要单独去找供应商解决吗?
周卫林:我觉得企业不会有太强的先入为主观念,更多是看谁能真正把这件事做成。无论是数据中台厂商做,还是我们做,都无所谓。关键是每一波新技术出来,总会有新的玩家进入,传统厂商可能因为有历史包袱,跟不上或者出现理念冲突。
我们没有历史负担,可以用差异化的方式去实践,所以在跟数据中台厂商之间形成了区隔。我们站在数据中台之上,相当于做了一次理念上的升级,在专注力和先发认知上拥有一定优势。
就像Palantir一样,做了20年,没有AI的时候默默无闻,AI时代来了才被看到巨大的溢价。我们可能也是类似的情况。
爱分析:所以在您看来,语义层和数据中台是基于不同理念形成的两种技术架构?
周卫林:对。数据中台的核心逻辑是给人提供一个工作环境,让业务用上好的数据。它卖的是一个平台,里面有开发环境、目录、资产管理等,让数据能在不同场景下工作。
但现在业务用例变了,不是给人用,而是给AI用。价值主张从通过人沉淀数据资产给人用,变成了让AI用上好数据,让业务用上好的智能。
如果认同这个转变,那么原来很多东西可以延续,比如ETL清洗、语义定义这些还能保留。但BI的宽表、强GUI的知识门户、各种看板等,会大幅减少。当前是95%数据平台是人在操作,5%是机器操作,两三年后会变成大部分由机器操作。
爱分析:从企业用户视角,原来大数据中台要迁移到面向Agent的数据基础设施,这个挑战看起来还是挺大的。
周卫林:对,我觉得有两部分。
第一是现有厂商大概率都会面临的挑战:怎么让用户继续用它?很多工具可能会变成AI可调用的命令CLI。比如任务调度,以前是人去配置,现在可能是AI在调用、在运维;同步工具、调度系统、监控预警、数据质量工具这些引擎类的东西,大概率还会保留。但上面的UI交互界面,比如IDE、可视化看板等,可能要重新做,使用方式会有很大变化。
第二是用户的切换调整,对厂商产品架构带来的挑战。原有的数据中台产品,如果是完全一体化的架构,改造工程量会很大;如果是松耦合的架构,就相对好调整一些。有些厂商会把原有系统解耦,变成AI能调用的CLI接口,甚至在自己体系里用AI替代部分开发工作。让AI自己来做研发。
这件事有没有可行性?我觉得有一定难度,因为里面有很强的业务知识,比较难完全表达出来。但研发形式肯定会变化,以后工程师不再是手写代码,而是用自然语言交互的方式来完成,大方向是可行的。
不过,有一部分岗位可能会被直接取代,而不是单纯被赋能。比如分析师做临时取数的那部分场景,80%可能被替代。以前临时取数的工单往往来自业务运营人员,他们最清楚具体场景和口径。如果语义平台能赋能业务人员,让他们自己通过语义直接获取想要的数据,那传统取数环节就没了。
所以你问我数据中台还在不在?我觉得中台里面引擎类的很多东西还会保留,但BI、专题分析、大量统计类的场景大概率会消失。
爱分析:关于Palantir,去年开始大谈本体论。您怎么看Palantir的本体论技术价值?和Aloudata提的语义层有关联吗?
周卫林:本质是一个东西,都是统一语义,最终目标都是决策和行动。区别在于场景:Palantir侧重运营决策,我们侧重管理决策。信息结构上没本质区别,只是出发点和路径不同。中国市场环境下,我们依托已有中台基础设施,更容易落地。不管叫Palantir、本体论还是语义层,最终都要看能不能在具体场景实现闭环、真正落地。

03 

AI时代数据厂商的价值在于管理数据,而非维护数据平台
爱分析:数据消费者从分析师变成Agent,会不会让数据基础设施的商业模式发生变化?
周卫林:场景应用大概率会按任务完成率、任务覆盖率定价,参考背后人工价值和并发度。订阅模式会更普遍。
中国市场私有云为主,token定价可能不是主流,但公有云可以。数据库层面,存储和调用量收费模式可能微调,但总体还是软件+订阅+按调用量付费的组合。
爱分析:从你们实践看,客户在什么痛点下会优先考虑上语义层架构?典型画像是什么?
周卫林:不是单一痛点,而是做过AI尝试后发现的问题。不靠语义层,只用传统方式,场景覆盖度低、维护成本高,停留在Demo,无法生产级可用。
核心是两个问题:第一是AI获取数据不可信,AI听得懂业务表达,但取数口径不准、不可追溯、不可审计。第二是AI获取数据不可控,AI直连数据库不可控,权限、限流、语义变更都难统一管理。
语义层解决的就是AI获取数据的可信、可控问题。在基于数据的Agent场景下,语义层已变成刚需。
爱分析:AI时代对数据厂商的机遇是什么?数据行业的核心壁垒和竞争力会在哪里?
周卫林:我理解是这样。从竞争角度看,厂商壁垒是建立在软件功能,还是帮企业维护它的数据。
如果你只是提供工具,而不碰数据,那竞争压力会很大。因为最好的数据当然是企业自己拥有。大多数有价值的数据都在私域里,公域化之后价值就有限了。你有没有特殊的渠道能持续拥有高质量数据,这很重要。
但我们现在的想法是:你到底是在帮企业管数据,还是只是在帮企业提供管理工具?如果你是在帮企业管数据,那情况会好很多。因为在AI时代,算力、算法、数据这三点里,数据仍然是企业自己能拥有的最大差异化资产。
所以AI时代数据厂商的核心壁垒和竞争力,我认为还是在于,你能不能把企业内部隐性的或显性的信息、生产资料,低成本地转化成AI能用的数据,或者说知识。
我们Aloudata现在的定位,更多是把企业内部那些本来很隐性的东西显性化出来,提供数据和知识的价值。而且转化过程能不能低成本实现,这也很关键。比如通过自动发现机制,从历史报表、查询日志、代码里面,自动化或半自动化地生成口径和语义。这一点竞争力很强。
爱分析:那Aloudata组织层面的核心能力沉淀在哪里?
周卫林:我觉得这个要分两层来看。
第一层,在AI时代,很多事情最终还是来自于人的认知。
AI的逻辑是,如果你这个人有想法,很多时候就能做到。所以人的想法和认知变得非常重要。
以前的壁垒可能来自于企业的流程、积累的代码,这些东西在AI时代大概还有作用。但回到核心问题上,公司有没有在这个领域拥有独特的认知和理解力,才是最关键的。这往往取决于公司里有没有那么5-10个人、甚至更多一直在前沿探索的人,他们能持续产生前瞻性的想法,并引领客户往前走。
这些独特认知的人数量有限,没办法规模化,但认知越领先的人往往探索越快,会产生马太效应,给领先者带来更大的正循环。
第二层,这些认知最终会落在组织层面。
它体现在客户侧的反应,因为有这样的人和认知优势,我们在市场上能拥有更多客户、更好的品牌和更强的锁定能力。
我们管的是数据和语义,这本身就很难切换,所以会形成一种强大的连接能力。客户绑定的不是某个人,而是公司本身。这种绑定关系又会反过来给优秀的人才提供持续的实践机会和输入,从而形成一个正向循环。
公司里有好的人,产生领先认知,带来领先的市场位置,获得更多客户反馈和锁定,能吸引并留住更好的人才,形成更强的公司竞争力。
爱分析:回到语义层本身,Aloudata核心护城河和竞争力在哪里?
周卫林:一个公司通常只有一个语义层,头部效应明显,先发优势关键。而先发优势来自语义定义能力和可执行性。这些需要长期积累几百上千个细粒度需求,我们过去多年的认知和实践,就是壁垒。
爱分析:目前Aloudata产品线是怎么布局的?AI方面主要探索哪些方向?
周卫林:我们有四个产品:数据虚拟化引擎Aloudata AIR、语义编织引擎Aloudata CAN、数据分析智能体Aloudata Agent、主动元数据平台Aloudata BIG。现在都在做CLAW化,把能力API化、CLI化,封装成Skill或命令行工具,让AI调用。现有UI给人用,未来通过CLAW给Agent用。
注:点击左下角“阅读原文”,查看更多洞察内容

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询