2026年7月9日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

香港中文大学李彤欣教授:电力Agent的应用|Agent Insights

发布日期:2024-06-28 08:08:45 浏览次数: 3231
作者:緑洲资本 Vitalbridge

微信搜一搜,关注“緑洲资本 Vitalbridge”


在提倡节能环保的大环境下,Agent 也加入了可持续发展事业中。Agent 如何实质性地推动智能电网和能源管理领域的技术进步?本周绿洲邀请到了香港中文大学的李彤欣教授,他在电力系统和可信机器学习领域拥有深厚的研究背景,带领团队探索了平等 Agent 框架,有望为个人、电力公司乃至数据中心带来节能省钱的解决方案,让我们听听他如何利用 Agent 帮助使用者省钱提效。Enjoy
《Building Socially-Equitable Public Models》

Equitable PM Agent 框架

论文链接https://arxiv.org/abs/2406.02790
解决问题:公共模型为各种下游任务提供预测,但一味强调预测准确性可能与下游 Agent 的不同最终目标相冲突。团队将 Agent 下游目标整合到优化过程,提出了公平目标(Equitable Objective),使下游 Agent 性能分布更加均匀,每个 Agent 都有自己独特的关注点
模型架构:Agent 架构分为两块,前端进行公共目标设定,满足于大家的公平性(Define Fairness),后端利用特殊的求解器进行计算与训练,最终保证 Agent 预测结果更贴近实际目标
应用场景电力 Agent、能源 Agent、交通 Agent 等一系列严肃场景
测试结果团队提出的 Equitable PM 框架能够将预测误差最小化,与不考虑下游 Agent 在不同环境下的目标方法相比,Equitable PM 能获得更公平的解决方案

Equitable PM Agent 框架部分测试结果

绿洲:请帮我们介绍一下您的经历与研究方向?


李教授:我从博士开始的研究方向是智能电网和可信机器学习,主要研究物理系统的控制优化,例如复杂网络系统的决策场景,如何对电网进行更好的控制,或者对交通网络进行建模优化。电网里有很多物理定律和条件约束(例如基尔霍夫定律、欧姆定律等)是非线性的,导致整个优化问题非常难求解。电网过去有 PID,LQR 或者 MPC 这种模型预测控制,它们本身没有充分利用到采集到的数据,然而我们平时网络监测到的反馈数据本身是非常有价值的,例如我们可以用强化学习从过去数据中学习生成更好的决策行为。

这些 AI 决策往往并不是可以直接采纳的。如何通过引入可信超参数,使算法兼顾 Worst-Case 保障(又称“鲁棒性”)和对有利 AI 决策的充分采纳(又称“一致性”);不同模型在不同 AI 决策范式下一致性和鲁棒性怎么样严谨定义并比较;在理论层面,对于任意算法,它们是否存在彼此之间的 Tradeoff 等,都是我在博士期间研究的方向。我的背景和传统深度学习研究不同,我关注严肃决策场景中的人工智能。有别于其他机器学习学者偏向于虚拟场景,我更感兴趣于真实大规模物理系统中 AI 方法扮演的角色及与之相对应的难点和挑战。


可信机器学习的潜在应用价值是非常高的。在一些实际场景中比较关键的严肃系统中,一旦出了一点小错,或者不符合它本身设立的约束条件,那么就可能会造成一些很严重的后果,经济损失也很大。如何让建立在基模之上的 Agent 可信,还有 Agent 核心的决策可信度如何提升等,都是我现在研究的方向。


在应用层面,我的研究涉及到很多电力系统的案例,因为电力系统是可控机器学习中比较理想的应用落地场景,保证电力系统不出重大的错误和自动驾驶对安全性与鲁棒性的要求类似,一旦系统提供了超过容量的指示,也许就有面临电线烧毁的可能。所以电力系统未来是 Agent 应用的一片沃土,而可信方法会让 Agent 充分照进现实。


绿洲:请帮我们介绍一下开发 Equitable PM 的初衷?


李教授:这个工作由 UCR Shaolei Ren 老师团队和我共同完成。做 Equitable PM 的动力从我们思考未来 Agent 发展方向开始,未来底层基模大概率会变成公共服务。然而每位用户使用 Agent 时,由于目标不同,很难为每人形成一个公平的定制化服务。因此我们想开发 Equitable PM 这一套框架,来更好地服务每位用户在调整模型时的目标优化差异。这次讨论的论文中列举了数据中心的例子,我们利用 Agent 来预测数据中心的碳排放效率(Carbon Efficiency),用户选择 Agent 提供的公共服务,预测掌握未来碳排放的高效程度,来优化数据中心的成本。数据中心的优化决策依赖于模型的预测时间序列。


然而用电模型的优化程度,在同一个类似场景的另一类细分应用需要预测的终值又完全不一样。例如:数据中心我们需要预测最近几天的电价以及与其对应的用电效率,充电桩我们需要预测最近几小时对应的相似的数据,那么同一基模之上我们设立的 Agent 需要完成的任务目的是完全不同的。我们的方法可以在许多类似的不同场景中用来训练 Agent 模型提供公共服务,实现用户层面的社会公平。


绿洲:请帮我们解释一下 Equitable PM 框架的开发方式?


李教授:Equitable PM Framework 包括两部分。第一部分是公共目标设定,简单来说就是如何定义满足于大家的公平性(Define Fairness),从数学定义如何权衡每个个体的期望,这个期望在电力领域中通常就是用户得到的平均成本(Average Cost)。如果我的用电成本和大家的区别太大,那我肯定不满意。为了刻画社会公平,我们引入一个 q 参数去权衡。其本质上类似于数学里面范数(Norm)的概念,可以将参数设立为范数中的变量 q 进行调节,再进行大规模采样之后算出平均数。


第二部分是训练,有了这样的数据之后没办法用传统的求解器(Solver)进行计算,因为有些用户的优化成本是离散、不可求导的函数,此时我们需要用一些黑盒优化的方法来做,那么会需要把一些采样数据放到一个 Batch 里进行优化求解。


绿洲:请问在数据中心以及 EV 充电桩两个评测案例中,我们是如何设置实验的?


李教授:第一个在数据中心的例子中,我们假设有 50 个数据中心,统一采用一家公司的预测服务,里面的模型都用时间序列预测模型(LSTM)进行预测。模型中我们有自己的参数,它决定了每个时间段里这些数据中心的碳排放值,这个预测给到每个数据中心后,通过合理的数学公式进行成本建模,这个数学公式中涉及的数据包括可再生能源和化石燃料随着时间变化的分配比例。每个用户都想最小化自己的成本。此外我们还用了 Azure Cloud 的 Workload Data。


第二个 EV 充电桩的例子,我们假设它的公共模型是 Transformer 架构,利用比较简单的单层编码器-解码器组合,利用位置编码(Position Encoding)进行向量处理。这个场景中的用户到充电中心充电的时候会有预测值显示,对于不同电价会有不同的充电量建议,中间包含了复杂的水消耗、碳排放等具体数据,全部组合在一起能够给用户一个最佳决策结果。这部分数据一部分用的是我在加州理工校园充电桩项目中实际收集的数据,用户行为在不同年份(疫情前、疫情后)、不同时间段、不同天气的数据截然不同,再加上美国的电网系统有非常多不同的供应商(美国基本每个州都有自己的电力公司,不像国内仅有几家大型电力公司,建模起来复杂得多。


这两个示例中我们的 Equitable PM 框架都可以保证社会公平。在 Equitable PM 框架中,第一部分的公共目标设定至关重要。作为工程师需要深度了解用户需求,并反馈给系统设计人员,让他们知道用户实际关心的成本到底是什么,才能更准确地权衡模型。此外,一旦模型设立好,就能提供给用户极具个性化的预测方案。在新能源渗透率不断提高的背景下,这种方案在大公司,电力公司或者聚合商会有非常大的需求,因为它们可以更好地预测未来。


绿洲:您下一步准备做些什么?


李教授:过去我在博士期间做的主要工作比较偏理论,以后的方向我会尝试将研究做得更落地一些。例如我现在感兴趣的方向是基于大模型,在垂类的场景中更好地微调。传统的优化方式会使用 LoRA 或者 QLoRA 等方法,但当有几千上万个用户之后,就要考虑如何权衡,是设计一个模型(比如包含进去一些经济指标,减少和 Agent 之间的交互),还是我们如何把公共模型多个 Expert Agent 结合。


另外我现在也比较关心在线决策问题,如何利用 Agent 来更好地解决在线问题。因为在线其实是很实际的问题模型,很多决策都需要即时来做,用户并不知道未来会发生什么事,Agent 会给你更好的建议与提示,但 Agent 的建议偶尔会有问题,也不一定完全可信。一旦在重要系统里出错,后果会非常严重。把错误修正方式融入到模型训练过程中,也是我现在关注的 AI 在线决策的场景。


绿洲:您觉得现在 Agent 实际应用比较欠缺的点是什么?


李教授:我觉得实际应用中一个很重要欠缺的点在于通用 Agent 如何能“接地气”。是否能通过例如和传统方法结合等模式,让人信任并使用 Agent 系统,怎样说服用户从传统方法转变为真正信赖并使用 Agent。举个简单的例子,我熟悉的电网控制中逆变器,连接了光伏和整个电力系统,光伏并网需要把交流变直流,传统方法已经有很多标准化的执行方式,比如传统电网下垂控制已经有国际知名的标准体系,但其并没有使用过去电网积累的大量运行数据。最近也有用 Agent 的方式来优化决策的案例,在特殊实验场景有不错的效果。然而如何让 Agent 变得可信,在实际应用中落地,还有很多困难要克服。
总而言之,短期 Agent 的能力发挥,当前模型已经够用了。但对应下游应用,仍然需要领域专家对模型输出做特定的优化,最终通过特殊设计保证这个系统使用之后不会崩溃,这样 Agent 在提升系统的高效一致性的同时,也不会失去传统解决方案的可靠性,还能替用户省钱。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅