微信扫码
添加专属顾问
我要投稿
在现代工业中,研发(R&D)对于提高工业生产力至关重要,尤其是在人工智能时代,研发的核心方面主要集中在数据和模型上。
RD Agent 旨在自动化这些高价值的通用研发流程,让AI驱动数据驱动的AI。
所以这个框架是的对于不是进行数据驱动的科研之外暂时没有太好的应用案例,但是其原理我们可以学习借鉴一下。
从方法论上讲,RD Agent 提出了一个由两个关键部分组成的自主代理框架:(R)esearch 代表通过提出新想法来积极探索,(D)开发代表实现这些想法。这两个组成部分的有效性最终会通过实践得到反馈,双方的研发能力都可以在过程中不断学习和成长。
上图显示了 RDAgent 的整体框架。
大致流程如下(注意两个专家角色的职责和交互):
这个基本的方法框架,不断提出假设、验证它们并从现实世界获得反馈。 这也是我们知道的第一个支持与实际验证链接的科研自动化框架。
对详细代码感兴趣的话,可以看看下面的工作流,展示了框架主要的类的交互:
还可以看看这个论文,了解更多的细节:
Co-STEER 是一种处理以数据为中心的开发 (AD2) 任务并突出其主要挑战的方法,这些挑战需要专家般的实施(即从实践中学习领域知识)和任务调度能力(例如,从更简单的任务开始以提高整体效率),这些领域在很大程度上被以前的工作所忽视。我们的 Co-STEER 代理通过我们不断发展的策略来增强其领域知识,并通过收集和使用特定领域的实践经验来提高其调度和实施技能。有了更好的时间表,实施就会变得更快。同时,随着实施反馈变得更加详细,调度准确性也会提高。这两项功能通过实际反馈共同发展,从而实现协作式发展过程。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-05
普林斯顿大学RLAnything:AI学会一边学习一边给自己打分
2026-02-04
Agent 越用越聪明?AgentScope Java 在线训练插件来了!
2026-02-03
OpenClaw之后,我们离能规模化落地的Agent还差什么?
2026-01-30
Oxygen 9N-LLM生成式推荐训练框架
2026-01-29
自然·通讯:如何挖掘复杂系统中的三元交互
2026-01-29
微调已死?LoRA革新
2026-01-19
1GB 显存即可部署:腾讯 HY-MT1.5 的模型蒸馏与量化策略解析
2026-01-18
【GitHub高星】AI Research Skills:一键赋予AI“博士级”科研能力,74项硬核技能库开源!
2025-11-21
2025-12-04
2026-01-04
2026-01-02
2025-11-20
2025-11-22
2025-11-19
2026-01-01
2025-12-21
2025-11-23
2026-02-03
2026-01-02
2025-11-19
2025-09-25
2025-06-20
2025-06-17
2025-05-21
2025-05-17