2026年7月9日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

Manus 的狂热和争议之后,我和 AI 开发者们聊了聊 :这是智能体的胜利吗?

发布日期:2025-03-12 21:38:24 浏览次数: 2452
作者:APPSO

微信搜一搜,关注“APPSO”

推荐语

深入探讨Manus背后的技术真相,揭示智能体的真正价值。

核心内容:
1. Manus技术发展和传播历程的回顾
2. AI开发者眼中的Manus技术实力与争议
3. 通用型智能体的能力和潜力分析

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
自从发布以来,Manus 经过了一个堪比过山车的传播历程。
从一开始的惊艳,到被加速捧至高点,再到遭受套壳、营销的批评,一切都发生在短短一周内。
在各种各样的声音当中,我们找到了和 Manus 最为相关的一群人:正在参与 agent 以及配套设施的开发者们,聊了聊他们眼中的 Manus——不讨论营销和争议,仅仅是技术层面。
结论并不复杂:Manus 无疑是一款优秀的产品。以「套壳」为理由来否定 Manus,是它的无妄之灾。
同时,「缝合」一词,也并不公允。一个通用型 agent 的能力和潜力,不仅体现在链接了多少工具,更在于对于 agent 本身的认知。
那些围绕营销和套壳展开的争议,指向的是一个问题:Manus 的价值到底是什么?
横空出世的「全球首个」
快忘了上周盛况的朋友们,这里有一个快速回顾:3 月 5 号深夜,Manus 上线内测,在官方展示的视频中,放出了好几个原本只在 PPT 中才会出现的精彩使用案例,无一不展现出 Manus 独特的任务理解和执行能力。
老实说 Agent(智能体)并不新鲜,但 Manus 打出「全球首个通用型智能体」的说法,掀起了前所未有的讨论浪潮,也让「通用型 agent」走到台前。
由于内测使用需要申请邀请码,且发放速度慢,一时间造成了哄抢的局面——用例有多惊艳,用不上的人就有多焦虑。
这种邀请码的机制,阴差阳错地把 Manus 推到一个近乎诡异的热度,甚至被称为「又一个 DeepSeek 时刻」。
DeepSeek 是模型,Manus 是智能体,是截然不同的两种产品。然而某种程度上,二者的历程,确实有相似之处。
DeepSeek 做的是模型,但它并非是从零开始,而是在一系列已有的开源工作上,实现了工程上的胜利。
类似地,Manus 实际上并非第一个做通用型 agent 产品,在 2023 年同类产品就涌现过一轮。Manus 本身也从大量开源工作中获得帮助,团队此前曾经打造过 monica,一款集成式 AI 助手,积累了丰富的 agent 工程经验。因此,Manus 也同样被视为一种工程上的胜利。
工程上的胜利究竟是指什么?
这个问题必须回到「通用型 agent」是什么这个根本源头上。
人跟动物之间的区别在于制造和使用工具,这句话,放在 agent 身上也成立——普通 agent 和通用型 agent 的区别在于,后者能够主动调用工具
「很多人觉得 agent 就是原来的对话机器人,接上数据库,就叫做 agent。实际上,一直以来 agent 的定义都是需要能使用工具,能真正的有所行动。」 William Lee 解释道,他从去年开始和创业团队一起开发针对 agent 的中台系统 ACI.DEV,就是在为 agent 类产品提供尽可能便捷的 API 调用服务。
在具体的产品使用上,工具调用能够把 agent 的能力边界,再推得更推远一些。活跃在 agent 开发社区的坚白,见识过 Manus 在执行上的能力:剪视频。
「剪的效果怎么样另说,但是它可以去做到,可以完成,不会拒绝你。」
原理并不复杂:剪辑的动作,可以在一定程度上以代码的方式来实现。又或者,一些在线工具可以被调用出来,完成剪辑的动作。
这样完成的剪辑当然是粗放的,成品跟人工剪辑无法相提并论,但就像坚白所说,Manus 不会拒绝这个要求,而是会主动寻找工具完成。「在过去的应用里,agent 可能会推荐给你一个剪视频的网站或者工具,但没有这样端到端的结果。」
他认为这反应了 Manus 团队的认知,是在一种更有高度的位置上。「我认为他们把代码,包括整个代码的运行环境,更多作为工具,而不是目标。」
曾经一些类似的项目,给出一段代码或者设置虚拟机,就已经是最终目的。而 Manus 的理解是,设计虚拟机跑代码,只是实现方式,它们是为了完成某种目的而存在
「我觉得是他们在认知上有领先」,坚白说,「大家都在说要把 agent 当成人看,但他们真的是认真思考了 agent 如何作为一个主体。」
Agent 最重要的是「大脑」
那么,虚拟机是那个让 Manus 脱颖而出的设计吗?
「虚拟机不是一个 creative 的设计,」同样是在做通用型 agent 产品的郑浅解释。
郑浅所在的公司 Convergence.ai,在 1 月时推出了同样属于通用型 agent 的产品 Proxy,并且在 webvoyage 基准测试中险胜 OpenAI。
不久前 Proxy 登上 Product Hunt 榜单,郑浅忙着带领工程团队应对突然涌来的流量。他们面对的是海外市场,可见通用型 agent,在海内外都是被寄于厚望的 agent 形态。
「OpenAI Operator 就是虚拟机,Manus 是给 browser use 之后,加了一个 coding execution,然后放到一个虚拟机里面去实现。」
Browser use,是一个在 Github 上获得了 4 万星的开源项目,它相当于把网页浏览器放在了 agent「眼」前,结合了大语言模型以及视觉识别。用户只需要通过自然语言,就能让智能体对网页上的元素进行实际操作。
早期 Proxy 也尝试过类似 browser use 的路线。「通过这种方式帮用户做点击、拖动等等的动作。整体是比较简单直接的,只需要用户给一个任务,它一步一步去执行。」
这个形态比较线性,无法胜任更复杂的任务。或者说,当任务的复杂程度上升,需要用户给出更有细节的指令,反而成了对用户的挑战。
「我们公司算开始得比较早,跟 OpenAI 和 H Company 他们也比较多交流,后来 OpenAI Operator 出来,agent 一下就变火了。大家很快就往一个新的东西上面去靠拢,就是 agent orchestrator。」郑浅非常明确,「可以说 general agent 真正的区别,不在于缝合了多少工具。
建设一个普通的 agent,可以用「缝合」简单粗暴地概括。但是要建设一个 general agent,必须是一个系统工程。
「你可以把 agent 想象成一个人,最复杂的部分在于核心决策系统——就是大脑和神经传输。其次复杂的是执行构建,比如说相当于人类的四肢与末端。至于你刚才提到的生成报告、浏览器交互、代码执行等功能模块,本质上属于工具链层面的能力。
人并不是生下来就会走路的,婴儿只会胡乱挥舞手脚,然后会爬、会站,磕磕绊绊地学会走路,最后学会精准地控制自己的四肢。
整个学习的过程,也是大脑逐渐成熟的过程。Proxy 的绝大多数工作都在围绕这个「大脑」展开,具体而言,是 planner agent 所负责的动态规划。
「有一个调侃是,规划不能预测未来:规划可以做的很好,但你不知道未来会发生什么。放在 agent 上面也是一样的,比如说它浏览某个网站,碰到无法打开的情况,比如改版啊或者域名过期,或者直接关停等等,那这时候 agent 该怎么做,这就需要动态规划。」
Manus 实测中,碰到网站登录及验证问题
一个典型场景是验证码,Proxy 和 Manus 可以解决一些简单的验证码,但太复杂的还是需要交回给用户,也可能被直接跳过。
郑浅解释难度藏在细节里,「都是细节,而且情况非常多样。如何在规划上去实现复杂任务,同时又能回传——用户基数一大,做什么千奇百怪的事情都有,如何覆盖各种各样的场景是很大的难点。
现阶段 Manus 并非尽善尽美,但它足以作为一个工程启示录。「它主要的成功之处,确实就是在工程上面」Wiilliam非常认同这一点,「它结合了市场上已有的模型,很好的跟工具做了对接,然后让用户第一次看到,真正可以调用工具的agent到底能做出什么样的效果。这样子我觉得百分之百是工程上的胜利。」
真正的胜利属于生态
Manus正像是那个正在学走路的幼儿,它能够造成巨大的讨论,并不在于它已经能走多远、跳多高,而在于展示出了足够的潜力。
这或许才是它最大的贡献:Manus的走红,让一系列与 general agent 类的应用,乃至基础建设的工作,都渐渐浮出水面
最新的进展是 OpenAI 推出了 Responses API,这是一个面向开发者,而且就是 agent 开发者的新发布。
在开发者社群里,Manus 更加是激发了许多想法。坚白正在做和 agent 记忆相关的项目,Manus 的出现让他开始重新思考记忆储存相关的范式。
记忆储存对于 agent 的实际工作至关重要,这不仅影响着 agent 能否从过往任务里学习到经验并沿用,也影响着能否形成关于用户使用习惯的记忆,真正做到个性化。
另外,通用型 agent 在理论上有着最大的自由度,可以链接和调用任何工具——在延迟、接口标准化等方面足够好的前提下。这正是 ACI 这类中台型产品,所想要提供的服务。
这可能是 Manus 最成功的一点:它作为现阶段通用型 agent 最出圈的案例,为一系列配套设施打开了想象和探索的空间
「其实通过 Manus 可以看到,现在模型已经跑在工程的前面很多了。」William 认为工程方面还有很多可以探索的空间,「我们还可以在工程上面继续做点什么,来拉高这种 AI agent 产品的效能。我个人的看法是现在 agent infrastructure 这一端的话都还是挺不成熟的,包括像我们这种工具调用平台,或者是说这种 memory layer,这些在工程方面都还有很多方向是可以优化的。」
这也是我们跟开发者社群接触下来最大的感受:他们感到兴奋与跃跃欲试。「通用」两个字所包含的可能性,前所未有的生动。
Proxy 马上要基于新的 parallel agent 思路,推出迭代的版本。郑浅一直在观察社群的反馈,他看到许多用户把 Proxy 用出了自己根本没过的方式,不断被挖掘出新的可能。
「大多数产品最后的使用目的,都不太会是一开始开发的目的,可能后面是由用户来发现我们没有发现的用途,我们也在等待那一个moment的到来。」

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅