2026年3月27日,来腾讯会议(限50人)了解掌握如何用Openclaw构建企业AI生产力
免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

终于测到一个不像玩具的AI Agent了

发布日期:2026-03-25 07:01:53 浏览次数: 1636
作者:梦飞 AI

微信搜一搜,关注“梦飞 AI”

推荐语

终于测到一个不像玩具的AI Agent了!QoderWork能直接操作你的电脑,替你完成真实工作任务,再也不用担心登录和验证码问题。

核心内容:
1. QoderWork的核心功能:桌面端AI Agent可操控本地浏览器执行任务
2. 实测亮点:调用已有登录态,突破传统Agent的登录验证瓶颈
3. 真实场景测试:跨平台调研比价等复杂任务执行效果展示

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

Qoder 最近出了一个新东西,叫 QoderWork。一个可以直接操作电脑、替你执行任务的 AI Agent。



这类产品,最适合拿真实工作场景来测。因为大家现在已经不缺“会说话的AI”,真正稀缺的是能把事情做完的AI


这次实测,来自我们团队里的 Qoder 深度用户。自从 Qoder 发布后,他月月都是 130 刀的 Pro+Ultra 用户。从 Pro 到 Pro+ 再到 Ultra,一路升级,累计付费已经接近 500 美金。



说实在的,很多产品测评体验一下不难,但能让人长期真金白银订阅,而且还是这么贵的订阅,那说明它确实有点东西。


所以这次,QoderWork 一出来,我们也第一时间安排了实测。看看这个“能指挥电脑干活”的 AI Agent,到底如何。


01 先说说,QoderWork能干嘛


上测试前,咱们先简单了解一下这个新产品,QoderWork是一个桌面端的AI Agent,一款专为日常工作而生的 AI 效率工具。它将 Qoder 的 Agent 能力从代码领域扩展到了日常工作场景。


让任何人都可以通过对话,只需说出想法,Agent直接在电脑本地完成工作任务。



整个体验下来,最令我们感到惊艳和好用的,是QoderWork对本地浏览器的操控能力。


注意,不是那种内置的无头浏览器,而是你电脑上的登着你账号的本地浏览器。


这就意味着,他在操作浏览器的时候能调用你已有的登录态。微博登着、淘宝登着、招聘平台登着,QoderWork都能直接用。


我之前在用这种工具最怕的就是,每次让他干点啥我都得盯着他。一会得登录了,一会要验证码了,让他替我干个活,我比他都紧张,一会忘了看他,任务就停在那不动了。


而QoderWork能调用已有登录态,那么就再也不用怕各种登录防护和烦人的验证而导致任务中止。


这一个点,小伙伴给的反馈是:真香。


02 实测场景:4个真实工作任务


说再多不如直接上手。


能在电脑桌面执行任务整理文件的应用现在有很多,我的电脑桌面已经被800个Agent整理过了。对于这种基操,我觉得我们就没必要多说。


所以,我们以下展示的是4个真实工作中,需要长程操作的复杂任务,我们直接看它表现。


实测1:跨平台调研比价,一条龙加购


我们先来一个采购场景:


公司技术部要给实习生采购笔记本电脑,我们让QoderWork试试能不能完成从调研到比价再到加购的全流程。


公司技术部门新招聘了实习生,需要采购4台笔记本电脑,调用浏览器对笔记本进行调研、比价。主要用于程序研发,预算9k,根据知乎的评价,给我在淘宝和京东上挑选合适的商品,一定要是官方旗舰店,挑选好后加入到购物车。


他没有直接开始一通搜索,而是给我抛出了3个问题:预算是单台还是总共?主要做哪类开发?对屏幕尺寸有偏好吗?



也确实,这些因素会影响采购的选择,问的好,我一一回答了它。


通常来说,回答完,这时候的Agent就要去电商平台直接搜索电脑,来匹配对应需求的电脑了。


但是,QoderWork又一次做了一个意料之外情理之中的操作:他打开了知乎。


搜索:“2026 9000预算 程序员笔记本推荐”



他没有直接去购买,而是像一个真人采购的逻辑一样,先去了解一下大家的评价和推荐,然后产生采购的决策,最后再去购买。


  1. 打开知乎,看“9000预算程序员用笔记本”的回答

  2. 打开淘宝,搜联想、ThinkPad官方旗舰店

  3. 切到京东,对比同款价格

  4. 最后把商品加进了购物车


它用的是已经登录好的知乎、淘宝和京东账号,不需要重新登录,不需要验证码。


这就像在三个不同部门之间跑腿盖章,只要中间一个环节对不上,整个链条就断了。



但QoderWork全程丝滑,一个环节都没卡。


实测2:Boss直聘简历初筛


第二个任务,估计HR一看就能共情。筛简历这个事,不干不知道,谁干谁头蒙。


我前一段想招个开发还有能帮我写公众号的人,我算是明白了,大家确实都是海投,不管三七二十一,只要关键词符合就是直接投简历。


只要一打开后台,就会有贼多的简历。。。每次看,一看就是几个钟头,眼都看花了。


所以,这次我试试让QoderWork帮我筛简历:


进入Boss直聘,查看当前给我发送的简历信息,查看在线简历,根据简历来综合评估,进行简历筛选。要求是本科,计算机专业,需要对AI有一定的了解,熟练使用常见的AI工具,能进行AI编程。



5分钟后,它给我交了一份“筛选报告”:



它一一看完,还给每个候选人标注了“有AI项目经验”还是“熟悉但无编程”这种细分。


其实,再进一步,QoderWork应该可以帮我直接和候选人沟通面试时间了。


也许,之后大家在招聘软件里看到的沟通可能不是HR了,可能是AI。


(因为涉及太多隐私信息,这里就用GIF给大家展示操作了)


实测3:租房信息筛选


第三个任务,抬高一下难度,在外地工作,难免碰到租房这个事情。


租过房的都懂,要求越多,符合的房源越少,而且很多得点进去查看,很麻烦。我一口气写了9个条件(位置、2室、精装、电梯、价格、面积、家具、可做饭、暖气。):


在安居客上查找1号线黄河南路、农业南路附近,整租2室,精装修,有电梯,价格不超过2400,面积不低于60平,家具齐全的房子,要能够做饭,有暖气,优先选择黄河南路附近。


QoderWork自己进入租房网站,主动筛选房源:



然后一一点开对比:



最终给我挑出了3套房子:



还主动标注了每套的优缺点。它不仅筛选,还额外做分析,给出明确建议。


这种“超预期交付”,给我的感受不是工具,更是搭子。


实测4:多平台自动发文


最后一个,是我自己的日常刚需。


写完文章要发多个平台,每次都要打开不同网站、登录、复制粘贴、调整格式...


烦。


以至于很多时候,我真的懒得搞,拖着拖着就忘了更新了。


所以,我想试试它能不能一键发多平台,而且我在提示词里明确要求了:根据平台特性改写内容。


在小红书发文,在知乎发布想法,主题是介绍QoderWork,字数200字以内。根据平台特性,对文章标题和内容改写。


因为我要求了“根据平台特性改写”,它真的给我改了:

  • 小红书版:更口语化,标题带“安利”,加了emoji

  • 知乎版:更专业向,数据更多,语气更理性



同时,这个任务里,小红书需要先点“一键排版”才能发布,知乎要先点“发想法”按钮。


就连发布也得因地制宜,不过这不是什么难题,QoderWork全部搞定了。



以上四个场景,全部都是一遍过的,全程无中断。


03 讲讲感受


总结下来,三个核心体验:


第一:真是工作用,不是玩具。


本地浏览器操作,这一点太重要了。


很多AI Agent用的是"无头浏览器",就是一个没有界面的浏览器内核。


每次操作都要重新登录、过验证码。


就像你雇了个员工,结果他每次进公司都要重新办门禁卡,然后还得一天办三次。。。


所以看似简单的一个转变,真的省事不少,而且这个本地操作是通过CLI做的,不是通过鼠标点击,所以,也不影响你做别的。


第二:执行稳,全程流畅。


以上这几个任务都涉及了多个平台切换。


每个平台的界面不一样,操作流程不一样,按钮位置也不一样。


很多Agent切换时容易卡住或者出错,执行实际任务的时候总是这里卡了那里停了需要协助。


但QoderWork这几个任务跑下来,全程没有卡过一次。


执行稳定性,是Agent能不能真正用起来的关键。


第三:与好用相匹配的价格。


说实话,这不是它的缺点,这是我的缺点。


以上四个任务,因为大量用到了视觉能力,我全程用的是旗舰模型,总计消耗了 6000 点积分,差不多相当于一个 30 刀会员的积分量。如果换成标准模式,成本还能便宜一半。


但从结果来看,旗舰模型的效果也确实撑得起这个价格。无论是页面理解、任务规划,还是跨平台执行中的稳定性和流畅度,整体表现都非常扎实。说白了,一个是QoderWork工程做得好,另一方面也是实打实的模型强,这个效果确实不是国内SOTA模型能比的。


另外,如果拿它和开源路线相比,比如OpenClaw,想达到这个效果,模型要自己配,环境要自己搭,稳定性也要自己一点点调出来。这里面花掉的,不只是订阅费,还有大量时间成本和调试成本。


所以,这个产品不便宜,但是也是真干活。


这也符合他的定位:本地运行、自主规划、安全可控的 AI 工作搭子


用在工作里提效,是值得的,只是拿来当玩具就太浪费了。


这次实测的4个场景只是冰山一角,对于QoderWork这样的Agent来说,真正的潜力其实取决于你的想象力和实际业务需求。


对于经常需要处理大量繁琐信息的从业者来说,QoderWork 确实是一个值得投资的生产力利器。


最后,大家平时在工作里,最想把哪项“脏活累活”外包给这样的隐形员工?欢迎在评论区聊聊,说不定下次测评,我就让它挑战一下你的专属场景!

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询