2026年7月9日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

智能体进化发展了一年,现在的RPA Agent迭代到什么程度了?

发布日期:2024-09-06 08:42:10 浏览次数: 4200
作者:王吉伟

微信搜一搜,关注“王吉伟”

  • 智能体进化发展了一年,现在的RPA Agent迭代到什么程度了?

  • 从实在智能最新发布的实在Agent 7.0,看RPA Agent的迭代升级

  • 抓取豆瓣信息、自己制作PPT,这款AI Agent真的实现了流程全自动化

  • AI Agent构建到执行全自动化,持续进化RPA Agent再次降低智能体应用门槛

  • 实在智能重磅发布实在Agent 7.0 ,这款神器做到了B端与C端通吃

  • C端AI Agent构建与应用实现端到端,这个智能体构建平台真的不一般


     全文约3000字,阅读时间5分钟
     文/王吉伟

智能体的爆发,意味着大语言模型的快速落地与应用。所以它一经提出便如泄洪之水一发而不可收,直至现在如火如荼。

尤其是在智能体工作流(Agentic Workflow)的加持下,智能体表现出了更强的易用性和适应性。除了解决简单工作流的自动化,也在积极融合进入更多的传统业务流程和应用场景。

王吉伟频道在《Agentic Workflow新范式,基于大语言模型的工作流、业务流程、智能体大融合》一文中提到过,广义上的Agentic Workflow是包含传统软件(工具、解决方案)、大语言模型、AI Agent等在内的新型业务流程的集合,其中用RPA等超自动化工具将轻量化LLM工作流与传统工作流相连接的工作流,将会成为企业业务流程的重要形式。

当前的AI Agent构建平台所构建的AI Agent通过各种插件和工作流已经可以做到较长的流程,但仍然无法操作没有API接口和没有开放API的大型以及遗留的企业级应用程序,并且API接口也不能保障绝对的稳定。

因此在智能体的应用上,用RPA来连接多种应用系统以保障数据的流通是不可或缺的,这对于已将RPA应用于企业运营人机交互层的组织来说则更加重要。

在企业级智能体的解决方案上,基于RPA构建的或者以RPA为tools的RPA Agent越发受到广大组织重视,原因正是它能够弥补单纯的API类智能体的不足,可以通过“API+UI”双重自动化极大提升智能体的应用潜力。RPA已经成为智能体的重要技术,也是实现基于LLM的智能自动化的必要技术之一。

从去年LLM爆发以来,RPA\超自动化厂商们也都在持续进化,完成了RPA Agent的产品化进阶。那么它们进化到什么程度了?在王吉伟频道写这个选题期间,恰好实在智能发布了最新产品实在Agent 7.0。这篇文章,我们就以这款产品为例,透视国产RPA Agent产品的发展情况。

先来看两个例子

在详细介绍实在Agent之前,先来看几个实际操作案例。

  案例1:采集豆瓣新片排行榜发送给同事

这是一个娱乐类的案例。如果你想为同事推荐最新的十部电影,过去需要打开豆瓣电影的新品排行榜,逐个复制电影名称,通过微信或者钉钉发送给朋友。现在使用实在Agent,只需要打开软件,输入 「采集豆瓣电影片排行榜前十(电影名、评分)」,它就能自动分析你的需求并拆解成执行步骤,然后点一下 执行 ,它就会自动采集相关数据并把数据填入到钉钉,发送给你的同事。

  案例2:在腾讯文档制做年终汇报幻灯片

这是一个办公应用的案例。按照正常步骤操作这个业务流程,需要打开腾讯文档,搜索相关文档,再制作成PPT。使用实在Agent智能体,只需要告诉它 「明天要去汇报,去腾讯文档里做一个叫年中汇报的幻灯片 ,它就会把你的需求拆解成相应的执行步骤,然后点击 执行 按钮,几分钟后就能在腾讯文档走出一个幻灯片。

除了这两个案例,实在智能还给王吉伟频道展示了获取百度贴吧前10个热门贴吧相关信息、京东关注商品降价通知发送、京东购物车商品结算等案例。

王吉伟频道还实际测试了12306查询车次、给微信好友添加标签及发送信息等应用案例,都能一一完成。实在Agent智能体预制了很多代表性案例,感兴趣的朋友可以亲自尝试。

据悉,目前实在Agent已经能够对钉钉、微信、企业微信等集成办公软件进行精确操作,并能通过屏幕识别技术对淘宝、京东、携程及12306等网站进行精确识别。

实在智能正在对更多的软件系统进行适配,以后大家需要操作的工作、生活及学习等业务流程,都能通过使用自然语言与实在Agent智能体交流实现相应业务流程的自动化,且这些Agent流程都是可以复用的,一次创建多次使用。

实在Agent 7.0.0有什么特点?

以上两个实操案例,来自于实在Agent 7.0。新版Agent 7.0具备以下几个特点:

  • 自然对话交互:“All in One”式助理工作体验;

  • 意图理解、流程规划:更为强大的意图理解+流程精准拆解规划能力;

  • 多代产品能力集成:实现一代RPA、二代IPA数字员工元素拾取、组件、流程编排等全部能力集成;

  • 软件界面精准操作:Agent多模态屏幕语义理解,屏幕扫描识别,界面精准操作;

实在智能千亿参数训练的底层TRAS大模型也再次进化,训练参数量更大,支持自然语言沟通工作、科普知识,高效执行任务完成工作,对话工作两不误。

在智能问答方面,基于实在智能文档系统(IDP),能够给实现文件的精确问答及处理。

此外,该公司已经继续深入探索企业大模型、数字员工运营管理平台、RAG和Agentic Workflow等技术和产品整合研究,实在智能创始人孙林君曾在2024年世界人工智能大会上提到“企业大脑”解决方案。

目前它们正在逐步推出企业知识库定制训练服务,通过RAG让Agent能够回答企业内部专属的知识内容和流程内容,让知识和流程资产创新价值。

之所以能做到这些,在于其对于技术和产品研发的执着,并且产研投入量极大。此次版本大更新花费近一年时间,深入更新迭代了底层较多技术架构、功能架构、RPA组件等。

实在智能在RPA有6年技术沉淀,在AI有6年能力、人才等的积累,多年的技术沉淀、对市场需求的准确把握以及对技术走向的前瞻性预判,使得他们能够在LLM与AI Agent爆发之后先一步扛起RPA Agent的行业大旗。

作为国内首家发布明确意义上的AI Agent智能体的公司,实在智能的系列产品已经先一步实现依据个人诉求生成工作流程、识别工作环境(浏览器、网页、通讯软件、工作软件等)、自主执行任务及流程,在保证智能体能够在B端为广大组织提供企业级服务的同时,也用标准化、易用化的产品进入C端市场服务更多个人用户。

与Coze等Agent平台有什么区别?

看了上面两个案例,是不是感觉使用实在Agent超级简单?

没错,使用实在Agent智能体的全部流程仅是 「输入需求-点击执行-收到结果」 这么简单,完全不用考虑其他操作,实现了软件使用上的端到端。理论上,随着软件的不断迭代,这种端到端的方式可以做到任何业务流程的自动化创建和自动化执行。

提及智能体,目前大家更熟悉的可能是Coze、Dify、GPTs等平台上用户所创建的各种智能体。从上面的案例大家应该能够体会到,实在Agent与它们最大的区别是在智能体构建上几乎不需要人为参与(流程中断时需要人为干预),都由实在Agent自行完成。

其他平台的Agent构建方式是:人力构建智能体,智能体自动化执行任务。实在Agent的构建方式则是:自动化构建智能体,智能体自动化执行任务。这种方式,实现了从构建到执行的全自动化。

所以,在使用实在Agent智能体时,用户不用再像在Coze等平台一样通过输入提示词、选择插件、搭建工作流等操作去构建一个智能体,极大地节省了用户构建应用的时间(自动化构建可以让用户忙其他事情),并进一步降低了智能体的构建门槛,真正实现了一句话构建智能体,所想即所得。

此外,想要在智能体平台构建能够深度操作钉钉、微信等智能体,没有相应的API接口是无法实现的,且平台生态之间的API还存在着一定的连接安全性、限制性等问题,通过RPA模仿人类操作的形式则完成杜绝了此类问题的发生。

端到端这个术语经常应用于B端企业级技术解决方案,主要强调技术、方案、流程及系统的完整性,也更强调产品应用的易用性和广泛性。

实在智能的端到端,一方面可以理解为从B端到C端。因为实在智能要做的,不仅是能在B端为企业提供专业级的Agent数字员工解决方案,更要在C端为个人用户带来解决长尾低频自动化需求的智能助理。从全新的实在Agent 7.0来看,他们做到了。

另一方面,还可以理解为C端的技术实现。实在Agent把“端到端”的技术特点和便捷特性赋予了智能体的C端构建与应用,把“RPA人人可用”的愿景进一步拓展为”Agent人人可用”。在LLM的加持下,这个愿景将会快速变为现实。

2023年8月,随着实在Agent智能体的面世,实在智能成为国内首家发布AI Agent智能体的AI科技公司。2024年8月,实在Agent 7.0发布后,实在智能再次成为RPA业界首家推出Agent产品形态的AI科技企业。

而这个进程,仅用了1年。


全文完
【文末福利1】:后台发消息 WB,获取Workflow、BPM相关11篇论文
【文末福利2】:后台发消息 Workflow,获取Agentic Workflow相关25篇论文。
【文末福利3】:后台发消息 agentic,获取Agentic AI相关资源
文末福利4】:后台发消息 Agent2024,获取十份AI Agent研报及论文。 


RECOMMEND

推荐阅读

1、API难以解决AI智能体执行能力问题,AI Agent深度落地锁定RPA
2、【万字长文】数字员工、超级个体、具身智能,AI Agent未来发展十大研究方向
3、【万字长文】全球AI Agent大盘点,大语言模型创业一定要参考的60个AI智能体
4、AI Agent发展简史,从哲学思想启蒙到人工智能实体落地
5、RPA终极发展方向瞄准AI Agent,超自动化智能体时代已经开启
6、正在强烈冲击AI Agent的“准Agent” GPTs,真的会杀死AI智能体吗?


AIGC研究系列文章

智能体工作流开源项目大盘点,20个项目轻松构建Agentic Workflow

Agentic Workflow新范式,基于大语言模型的工作流、业务流程、智能体大融合【附十篇相关论文】

从Workflow到Agentic Workflow,25篇论文全面了解智能体工作流

Agentic Workflow加速Agentic AI到来,AI Agent成为重要实现方式

【万字长文】AI智能体驱动未来商业,深度剖析11种AI Agent商业模式

科技巨头紧锣密鼓布局智能体,你需要了解AI Agent行业未来发展的18个趋势

AI智能体构建智能未来,全球80+AI Agent构建平台大盘点

AI智能体全景式解读,SWOT视角下的AI Agent行业将何去何从?

【深度盘点】从科技巨头到创业公司,先一步布局的AI Agent加速应用落地

AI Agent涌向移动终端,手机智能体开启跨端跨应用业务连接新场景

AI Agent引爆AGI时代,十篇研报透视AI智能体的现在与未来

【万字长文】数字员工、超级个体、具身智能,AI Agent未来发展十大研究方向

详解AI Agent市场格局、技术路径与未来市场,智能体创业一定不要错过

API难以解决AI智能体执行能力问题,AI Agent深度落地锁定RPA

热闹的人工智能VS酷寒的资本寒冬,2023年AI Agent项目盘点与融资分析

正在强烈冲击AI Agent的“准Agent” GPTs,真的会杀死AI智能体吗?

AI Agent发展简史,从哲学思想启蒙到人工智能实体落地

【万字长文】全球AI Agent大盘点,大语言模型创业一定要参考的60个AI智能体

RPA终极发展方向瞄准AI Agent,超自动化智能体时代已经开启

从大语言模型到大流程模型,生成式AI带来的BPM范式转变

产业上下游齐发力LLM挺进端侧,大语言模型加速落地利好超自动化

从引入并集成多LLM到发布自研模型,RPA与LLM的融合进度怎样了?

ChatGPT与RPA集成,生成式AI+自动化流程让AIGC价值倍增

产业上下游齐发力LLM挺进端侧,大语言模型加速落地利好超自动化

业务流程将因生成式AI变革,ChatGPT引领的AIGC正在改变组织运营

更多组织接入ChatGPT等生成式AI,生成式自动化或成企业运营新标配

AIGC模式正在影响更多组织,十个案例助你深度认知生成式AI

多家厂商引入ChatGPT,集成与融合生成式AI成为RPA技术新趋势

基于AI构建的当代RPA,在生成式AI影响下的生命周期还有多长?

从ChatGPT数据泄露事件,看组织安全稳定自动化的重要性

大模型API上的新商业逻辑,生成式AI变革组织经营

生成式AI与客户体验有什么关系?如何影响客户体验?一文看明白

从几个业务场景和实际案例,看生成式AI在金融领域的应用

生成式AI席卷PPT制作,办公生产力迎来大变革,附20个正在流行的AI PPT制作工具

从RPA+AI到RPAxAI,弘玑走上全新LLM融合之路

LLM时代到来,生成式AI会成为超自动化蓬勃发展的催化剂吗?

AIGC持续火爆大模型争相推出,庞大市场造就算力供应模式演变

从“人+RPA”到“人+生成式AI+RPA”,LLM如何影响RPA人机交互?

生成式AI正在颠覆装饰装修领域【文末附28个AI装饰设计工具】

从LLM特性与数字化转型本质,看大语言模型对数字化转型的影响

2022-2023上半年全球RPA融资盘点:海外项目占比67%,总额165亿元

从AI模特换装到AIGC赋能运营,生成式AI全方位渗透电商产业链


  • 期待点赞、在看、评论、转发,您的支持就是我的动力。
  • 鼓励积极评论,您的留言可以成为选题。

  • 欢迎阅读其他文章,或会激发您的更多思考。

点击左下角“阅读原文”查看AIGC研究系列文章,扫码或者后台回复【加群】申请加入AIGC行业应用交流社群。如果你是正在关注AI Agent的创业者、投资人及企业,欢迎带着产品、项目及需求与王吉伟频道交流。

注:RPA相关文章,后台回复关键词 RPA 。
【王吉伟频道,关注AIGC与IoT,专注数字化转型、业务流程自动化与RPA。公号ID:jiwei1122,欢迎关注与交流。】


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅