微信扫码
添加专属顾问
突破性研究揭示复杂系统中被忽视的三元交互力量,为生物医学和生态学带来全新分析框架。 核心内容: 1. 三元交互在生物系统中的普遍性与重要性 2. 创新性三元感知机模型与TRIM算法原理 3. 在急性髓系白血病基因数据中的实际应用发现
导语
复杂系统通常包含超越成对网络的高阶交互。三元交互,即一个节点调节另外两个节点之间的交互,是许多生物系统中存在的一种高阶动力学的基本形式,从神经元-胶质细胞通信到基因调控和生态系统均可见其身影。然而,三元交互至今大多被忽视。本文提出了三元感知机模型,该模型表明,三元交互可以调节两个相连节点动态状态之间的互信息。基于这一发现,作者构建了三元交互挖掘算法,以从节点元数据中提取三元交互,并将此框架应用于基因表达数据,发现了与急性髓系白血病相关的新三元交互候选对象。研究结果强调了三元交互中常被忽视的关键特征,提供了一个能够深化我们对生物学、生态学和气候科学中复杂系统理解的新框架。
关键词:高阶三元交互(higher-order triadic interactions),三元交互挖掘算法(Triadic Interaction Mining, TRIM)、三元感知器模型(Triadic Perceptron Model, TPM)、急性髓系白血病(Acute Myeloid Leukemia, AML)、互信息(mutual information)
论文题目:Mining higher-order triadic interactions
论文链接:https://www.nature.com/articles/s41467-025-66577-z
发表时间:2025年11月25日
论文来源:nature communications
代码链接:https://github.com/anthbapt/TRIM
引言:被忽视的“第三者”力量
当我们思考网络——无论是社交网络、神经网络还是基因调控网络时,脑海中首先浮现的往往是节点(个人、神经元、基因)和连接它们的边(关系、突触、调控关系)。长期以来,网络分析领域大多聚焦于成对节点之间的联系。然而,现实世界的复杂性常常要求我们看得更深。在许多系统中,交互并非仅仅发生在两两之间,一个“第三者”可以深刻地影响甚至决定另外两者之间的关系。这种一个或多个节点调节其他两个节点之间交互的现象,被称为三元交互。
在生态系统中,物种A可能通过改变环境或行为,来增强或削弱物种B与物种C之间的竞争或共生关系。在大脑中,胶质细胞可以调节神经元之间的突触传递效率,从而控制信息处理。在基因调控网络中,调节因子可以促进或抑制某个转录因子与其靶基因的交互。这些都不是简单的A-B、A-C、B-C关系的叠加,而是一种独特的高阶交互模式。
尽管三元交互如此重要且普遍,但如何从海量的网络数据和节点时间序列中有效检测三元交互,仍然是一个尚未得到充分探索的科学挑战。现有的高阶网络分析方法,如基于超图或单纯复形的方法,往往无法捕捉这种“边调节”的动态本质。
对此,作者提出了一套融合动力学建模与信息论的全新框架 —— 通过三元感知器模型(Triadic Perceptron Model, TPM)揭示三元交互的作用机制,再借助三元交互挖掘算法(Triadic Interaction Mining, TRIM)实现从数据中精准提取三元交互。
定义核心:什么是三元交互网络?
要理解这项研究,首先需要厘清一个核心概念模型:三元交互网络。研究者将其定义为一个由两部分组成的异构网络(heterogeneous network)。
第一部分是结构网络(structural network),由节点(如基因、蛋白质)和连接它们的边(如物理互作、功能关联)构成。它描述了系统中“谁和谁有直接关联”。
第二部分是调控网络(regulatory network),是一个带符号的二分网络(signed bipartite network)。一端是结构网络中的节点(即潜在的调控者),另一端则是结构网络中的边(被调控的对象)。连接这两类节点的边,就是调控交互(regulatory interactions)。
这种调控作用通过带符号的矩阵进行编码:当矩阵元素为 1 时,代表该节点是对应边的正向调节器(positive regulator),会增强另外两个节点的交互;当元素为 - 1 时,该节点是负向调节器(negative regulator),会抑制目标边的交互;元素为 0 则表示无调控关系。值得注意的是,同一个节点不能同时对同一条边产生正向和负向调控,但可以对不同的边分别发挥正向或负向调控作用。
图 1 三元交互示意图。(图 a)调控节点 Z(regulator node),以正向或负向方式调控另外两个节点 X 和 Y 之间的交互时,便形成了三元交互。被调控的边可概念化为因子节点(factor node)。(图 b)包含三元交互的网络可被视为 “网络的网络”,由一个简单的结构网络(structural network)和一个连接着调控节点与被调控边(即因子节点)的二分调控网络(bipartite regulatory network)构成。
理论基石:三元感知机模型(TPM)
为了揭示三元交互如何影响系统的动力学行为,作者构建了一个精巧的数学模型——三元感知机模型(Triadic Perceptron Model, TPM)。
在这个模型中,每个节点都有一个连续的动态变量,并通过朗之万方程(Langevin equation)描述网络演化。在没有三元交互的情况下,节点动力学会形成一个由网络结构决定的平衡态,节点间的相关性矩阵可以反推出底层的连接模式,这是一种经典的高斯过程。
引入三元交互后,连接节点X和Y的耦合强度不再是固定的,而是变成了一个动态变量。这个耦合强度由一个类似于人工神经网络中“感知机”的机制控制:它取决于所有能调控这条边的“调控节点”(如Z)的动态状态之和。当这个总和超过某个阈值时,X-Y边的耦合强度切换到高值;反之则切换到低值。调控节点Z的集体状态,像一个开关,实时地控制着X和Y之间的交互强度,从而在动力学模型中真实还原了三元交互的作用机制。
由此产生的动态过程变得异常复杂,且无法保证动力学的稳态。模拟结果清晰地显示,当存在三元交互时,X和Y之间的条件互信息会随着Z的状态变化而发生显著波动。相反,对于没有三元交互的节点对,这个条件互信息则基本保持恒定。因此其动力学无法简化为仅由成对交互决定的动力学。那么能否从观测数据中挖掘出此类交互呢?
核心武器:三元交互挖掘(TRIM)算法
基于TPM模型揭示的原理,作者开发了TRIM算法,其目标是从观测到的时间序列数据中,自动、定量地识别出三元交互。
算法的核心在于从数据中捕捉互信息的动态变化。对于一个候选三元组(节点X,Y及其潜在调控节点Z),TRIM算法的核心步骤如下:
条件分割与互信息计算:首先,根据调控节点Z的时间序列值,将其划分为若干个区间(例如,按分位数划分,保证每个区间数据量相同)。对于Z的每一个取值区间,计算在该区间内,节点X和Y之间的条件互信息MIz。
量化波动特征:如果Z确实在调控X-Y交互,那么如上一步计算出的条件互信息值MIz,应该在不同Z区间上表现出明显的波动。算法通过两个统计量来捕获这种波动:(1)这些条件互信息值MIz的标准差(Σ),反应整体波动范围;(2)其最大值与平均值之间的绝对差(T),反应极端情况下的波动幅度。波动越大,存在三元交互的信号越强。
统计显著性检验:关键的一步是判断观察到的波动是否真的显著,而非随机噪声所致。为此,TRIM采用了双重零模型验证策略。第一种是随机化零模型(randomization null model),通过打乱Z的时间序列来破坏其与X、Y的动态关联。第二种是最大似然高斯零模型(maximum likelihood Gaussian null model),假设X、Y、Z三者服从一个多元正态分布。最后根据两种零模型的结果,识别三元交互。
功能模式分类:对于通过检验的显著三元组,算法还会进一步分析其特征。它使用决策树拟合条件互信息随Z变化曲线,识别出Z的不同取值区间(通常为2-3个)。然后,通过计算一个归一化熵分数S,来量化在不同Z区间内X与Y联合概率分布的多样性。当所有 Z 状态区间内 X 和 Y 的联合分布都较为分散时,熵分数接近 1;当分布都高度集中时,熵分数接近 0。S值越高意味着调控作用越明显。
TRIM算法的强大之处在于,它不预设调控函数的形式(例如必须是单调的),因此能捕捉到更复杂、非单调的调控模式。同时,双重零模型的设置也极大地减少了因网络结构相关性或数据异常值导致的误报。
图2 三元交互挖掘算法(Triadic Interaction Mining, TRIM)示意图。TRIM算法从已知的结构网络及其节点相关的动力学变量出发,识别涉及潜在三元交互的节点三元组(X、Y、Z)。对于网络中每个潜在的三元交互节点三元组(图a)——这些节点属于结构和动力学均已知的网络(图b),首先分析条件互信息的功能行为(图c),再结合零模型评估观察到的条件互信息调制效应的显著性(图d)。设定既定置信水平后,可通过这些统计数据识别显著的三元交互(图e)。该流程可扩展至网络中不同的节点三元组,进而全面识别网络中存在的三元交互(图f)。
模拟演练:合成数据下的高效性能
为了验证 TRIM 算法的有效性,本文首先在 TPM 模型生成的合成数据上进行了测试。研究者构建了一个包含 10 个节点、12 条边和 5 个三元交互的小型网络,通过模拟 TPM 模型的动力学过程,生成节点的时间序列数据,再用 TRIM 算法进行检测。
结果显示,对于涉及三元交互的节点三元组,其条件互信息MIz随调控节点状态的变化呈现出显著的波动;而对于不涉及三元交互的三元组,条件互信息则保持相对稳定(图 3),这与 TPM 模型的理论预测完全一致。分析联合分布的条件变化发现,正调节交互导致MIz在高Z值时上升,而负调节则相反(图 4)。
通过绘制受试者工作特征曲线(ROC 曲线)和精确率 - 召回率曲线(PR 曲线),研究者发现,算法的检测准确率在不同动力学参数下均保持较高水平,尤其是当模型中的 α 参数(与哈密顿量深度相关)较大时,性能更为优异。此外,算法的假阳性发现率(false positive rate)较低,且假阳性结果多集中在 “短程三元组”—— 即调控节点 Z 与目标边(X,Y)的端点 X、Y 在结构网络中距离较近(图 5)。
图3 三元交互对相连节点间互信息的调节作用示意图。作者构建了一个含10个节点、12条边和5个三元交互的网络(图a)。图(b)和图(c)展示了三元交互对互信息分布MIz的影响:图(b)为涉及正向三元交互的节点三元组[4, 9, 5]的MIz分布,图(c)为不涉及三元交互的节点三元组[1, 2, 6]的MIz分布。
图4 含三元交互的连续模型中节点三元组的代表性结果。是图3所示网络中具有三元交互特性的节点三元组[4, 9, 5]的分析结果:图(a)呈现了在Z的不同取值区间下,变量X和Y的条件联合分布;图(b)展示了互信息MIz随Z的分位数变化的行为特征,该特征明显偏离了无三元交互时预期的恒定状态;图(c)为拟合MIz功能行为的决策树,通过该决策树可确定Z的取值范围——在这些范围内,Z条件下变量X和Y的联合分布差异最为显著。本图所用模型参数与图3保持一致。
图5 TRIM算法在10节点测试基准网络上的性能表现。采用图 3(a)所示的网络结构,对含三元交互的动力学模型进行随机动力学积分,得到时间序列数据后,使用TRIM算法进行分析。图(a)展示了在不同参数值(见图例标注)下,TRIM算法的ROC曲线;图(b)为相同参数设置下对应的PR曲线。
为了测试算法的可扩展性,作者还在更大规模的网络上进行了验证:构建包含 100 个节点的随机厄尔多斯 - 伦伊网络(Erdős-Renyi network),添加 25 个随机的三元交互,再用 TRIM 算法进行检测(图 6)。结果显示,真实的三元交互均被赋予了较高的显著性分数,且熵分数普遍大于 0.5;而当网络中移除所有三元交互后,算法未检测到任何显著的三元组,进一步证明了算法的稳健性。这些验证结果表明,TRIM 算法不仅在小型网络中有效,还能稳健地应用于更大规模的系统,为处理真实世界的复杂数据奠定了基础。
图6 TRIM算法在含三元交互的100节点随机网络上的性能表现。(a) 每个数据点代表一个节点三元组(X、Y、Z):纵轴为显著性分数Θ∑,横轴为X与Y的条件互信息(CMI),数据点颜色对应熵分数(S)的取值(用于表征该三元组的熵特征)。合成数据来源于含100个节点的随机厄尔多斯-伦伊网络(Erdős-Renyi network),网络平均度c=4,并额外添加了25个随机三元交互(即随机边与随机节点之间的交互)。星号代表真实的三元交互,叉号代表经高斯零模型筛选后被排除的三元组。(b) 直方图展示了网络中所有三元组的显著性分数值Θ∑分布(浅蓝色),以及25个真实三元交互对应的显著性分数值Θ∑分布(深蓝色)。(c) 直方图展示了相同拓扑结构和动力学参数,但移除所有三元交互的网络中,三元组的显著性分数值Θ∑分布(橙色)。
实战应用:
在急性髓系白血病基因数据中发现新线索
随后,研究进入了最具挑战性的环节:在真实的生物医学数据中挖掘三元交互。研究选取了急性髓系白血病(Acute Myeloid Leukemia, AML)的基因表达数据,并结合了人类蛋白质-蛋白质互作网络( Protein-Protein Interaction network, PPI)作为先验结构网络。
通过TRIM算法对AML数据进行分析,发现了一批具有高度统计显著性的三元交互(图 7)。例如,三元组(GATA1, KLF1, ETV1)和(HOXB3, MEIS1, GLIS3)均被检测为显著三元交互,其中 GATA1、HOXB3、MEIS1 等基因已被证实与 AML 的发生发展密切相关。在排名前50的显著三元组中,高达84%包含至少一个已知与AML相关的基因。此外,算法还检测到部分非单调的调控关系,表明基因之间的调控作用可能比以往认为的更为复杂,需要通过更精细的模型来描述。
图7 TRIM算法在基因表达数据中的应用结果。图(a)展示了急性髓系白血病(Acute Myeloid Leukemia, AML)数据集中显著三元组的分析结果:散点图纵轴为显著性分数Θ∑,横轴为条件互信息(CMI),数据点颜色对应熵分数(S)的取值。本图仅展示随机化零模型下p值≤0.001、且未被高斯零模型排除的三元组;圆形代表所有连接均存在于最小生成树(minimum spanning tree)中的三元组,方形代表涉及生物学相关基因的三元组。图(b)-(c)展示了两个代表性三元组的条件分布,两者均被TRIM算法判定为高显著性,提示存在具有生物学意义的关联:图(b)为三元组X=GATA1、Y=KLF1、Z=ETV1,根据随机化替代零模型,该三元交互的p∑=0.00、Θ∑=4.7、∑=0.4、S=0.6;图(c)为涉及两个生物学相关基因的三元组X=HOXB3、Y=MEIS1、Z=GLIS3,根据随机化替代零模型,其Θ∑=3.9、p∑=0.00、∑=0.3、S=0.6。
讨论与展望:开启复杂系统研究的新维度
这项工作为我们理解和分析复杂系统提供了一个强有力的新范式。它表明,要真正捕捉系统的组织原则,必须超越成对交互,关注那些调节交互本身的“高阶纽带”。TPM模型从理论上确立了三元交互如何编码在动态信息流中,而TRIM算法则提供了一把实用的钥匙,可以从观测数据中解锁这些隐藏的模式。
从网络科学的角度看,这项工作为高阶网络的建模与推断开辟了新路径。未来的研究可以探索三元交互在离散变量节点动力系统中的作用,或引入调控的时间延迟效应。
从生物学和医学的角度看,TRIM算法为解读复杂的基因调控逻辑提供了新工具。它可以帮助我们系统性地发现那些“背景依赖”的调控关系——即只有在特定调控基因活跃或不活跃时,两个基因才会发生强关联。这对于理解疾病的机制、寻找组合药物靶点具有深远意义。
此外,该框架完全可以扩展到其他领域,如金融或气候科学,具有极其广阔的应用前景。
总而言之,这项研究不仅深刻揭示了三元交互这一普遍现象的动态本质,更将我们从“知道其存在”推进到“能够测量和发现它”的新阶段,可以成为我们解码复杂世界深层结构的重要探针。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-19
从 BERT 标注到 Agent Skill:短文本标签体系的四次“工业革命”
2026-05-14
多轮 Agent 场景下,滴滴的 EAGLE-3 训推加速实践
2026-05-06
谁说 Mac 只能写代码?Google 官宣:M 芯片本地微调 Gemma 4 时代开启!
2026-04-20
用 Unsloth 微调 Embedding 模型,让你的 RAG 检索不再答非所问
2026-04-15
ComfyUI v0.19.0 更新:大量新节点、新模型、新修复与性能优化全面落地,工作流与训练能力再升级
2026-04-13
Agent 持续学习落地路径:先做 Traces,再做 Context,最后才微调模型 | Jinqiu Select
2026-03-23
养死四只龙虾的小白有感
2026-03-22
Mistral Forge 的真正意义:企业AI从“租用”走向“拥有”
2026-04-15
2026-04-13
2026-04-20
2026-05-06
2026-05-14
2026-06-19
2026-01-02
2025-11-19
2025-09-25
2025-06-20
2025-06-17
2025-05-21
2025-05-17
2025-05-14
欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。
在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。
一、 定义
本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。
会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。
知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。
二、 账号注册与登录
登录方式:本网站支持以下登录方式,您可根据实际情况选择:
微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。
手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。
账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。
实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。
未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。
三、 服务内容与规范
知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。
服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。
禁止行为:您在使用服务时不得实施以下行为:
利用技术手段批量爬取、下载、转存知识库内容;
将知识库内容用于商业目的或未经授权地向第三方传播;
干扰本网站正常运行或侵犯其他用户合法权益;
发布违法违规信息或从事违反公序良俗的活动。
四、 知识产权声明
权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。
有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。
侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。
五、 个人信息保护
我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。
您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。
您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。
六、 免责声明
内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。
不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。
第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。
七、 违约责任
如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。
如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。
八、 法律适用与争议解决
本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。
因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。
九、 其他
本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。
本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。
我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。