2026年7月9日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

手机版openclawd来了,无需Root,让 AI 像人类一样使用你的手机

发布日期:2026-03-17 09:46:09 浏览次数: 2963
作者:GitHubStore

微信搜一搜,关注“GitHubStore”

推荐语

手机AI助手Andclaw来了!无需Root和电脑,动动嘴就能让AI帮你操作手机,真正解放双手。

核心内容:
1. Andclaw的核心功能:AI驱动+自然语言交互
2. 四大技术亮点:无需Root/独立运行/屏幕感知/拟人操作
3. 典型应用场景:视频搜索播放等自动化任务

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


之前给大家分享过不少手机自动化工具,最近又挖到一个有点意思的——Andclaw

一句话说清楚:它能让AI像人一样操作你的手机,做完任务还知道停下来。

不用Root,不用连电脑,手机上装个App就能用。

项目简介

Andclaw 是由个人开发者开源的一个Android自动化工具,核心理念是"让AI像人类一样使用你的手机"。

它是完全在设备上运行的,不需要Root权限,也不需要连接电脑。通过无障碍服务(Accessibility Service)读取屏幕内容,然后让AI分析界面、决定操作步骤、自动执行。

让 AI 像人类一样使用你的手机 —— 完全在设备上运行,无需 Root,无需电脑。

能做什么?

举几个官方文档里的例子:

  • "打开bilibili,搜索AI学习相关的视频,并播放" → AI会自己识别B站图标 → 点击 → 进入搜索页 → 输入"AI学习" → 点击搜索 → 选择视频 → 播放

你只要动动嘴,或者打打字,AI就去帮你操作了。


跟其他工具对比

方案
需要Root
需要电脑
独立运行
AI驱动
Andclaw
Auto.js
ADB+Python
可选
Frida+脚本
Appium
可选
UI Automator

Andclaw的核心优势:完全在设备上运行 + 大模型决策 + 自然语言交互。


主要功能

1. 无需Root

纯无障碍服务(Accessibility Service)实现,不依赖系统权限。不用天天刷什么Magisk、KernelSU那些破事。

2. 独立运行

完全在手机上独立运行,无需ADB或PC端配合。躺床上玩手机也能指挥它干活。

3. AI驱动

支持Kimi(月之暗面,国内直接能访问)和任意OpenAI兼容API。AI会自己分析屏幕内容,决定下一步该干嘛。

4. 屏幕感知

  • 实时读取UI层次结构(通过无障碍服务)
  • 浏览器/WebView场景自动截图,辅助视觉分析

这个挺重要的,因为有些App的界面无障碍服务读不出来,AI会自己截图看。

5. 拟人操作

官方文档里列出的操作类型:

  • click - 点击屏幕坐标(x,y)
  • swipe - 滑动(滚动、翻页),支持自定义时长
  • long_press - 长按,支持自定义时长
  • text_input - 向输入框注入文本(先尝试SET_TEXT,失败则用剪贴板粘贴)
  • intent - 启动应用、打开网页、拨号、发短信、设闹钟等系统Intent
  • global_action - 系统级操作:返回、Home、最近任务、通知栏、快捷设置
  • screenshot - 截图,保存到 Pictures/Andclaw/
  • download - 通过DownloadManager直接下载文件(不用先打开浏览器)
  • wait - 等待页面加载,最长10秒
  • camera - 拍照、开始录像、停止录像
  • screen_record - 录屏,保存到 Movies/Andclaw/
  • volume - 音量控制:设置、调高/调低、静音/取消静音、查询当前音量
  • dpm - Device Owner模式专用:应用管理、设备控制等
  • finish - 任务完成,停止Agent

关键是有循环检测功能:同一个操作连续做5次?AI会截图用视觉重试,最多3轮,15次后还没进展就自动停下了。不会死命点同一个地方点个几十次。

6. Telegram远程控制

人在外面也能用。通过Telegram Bot远程下发指令,截图、拍照、录像完成后会自动发到Telegram。

常用操作:

  • 直接发文字 → 作为指令下发给Agent执行
  • /status → 查询Agent状态(运行中/空闲、当前任务、Chat ID)
  • /stop → 停止当前正在执行的任务

7. 企业级管控(可选)

如果愿意折腾,启用Device Owner模式可以更强。但注意:Android安全限制,设备必须先恢复出厂设置才能启用Device Owner模式。

不启用的话,AI操作手机的权限会大幅受限。

启用后的能力:

  • 应用管理:静默安装/卸载应用、隐藏/显示/挂起应用、阻止卸载、自动授予权限、查询已安装应用列表
  • 设备控制:远程锁屏、重启、恢复出厂设置、禁用摄像头/状态栏/锁屏、USB数据传输控制、定位开关
  • Kiosk模式:单应用锁定(Lock Task)、替换默认桌面、禁止安全模式/恢复出厂

详细能力清单看GitHub上的 ACTIONS.md。


AI是怎么干活的?

下面是流程图:

用户指令
    ↓
[1.5s] → 捕获屏幕 UI 树(无障碍服务)
    ↓
浏览器/WebView?──是──→ 自动截图(视觉分析辅助)
    ↓
发送给 LLM(系统提示 + 最近 12 条历史 + 屏幕数据 [+ 截图])
    ↓
AI 返回 JSON 操作决策
    ↓
解析失败?──是──→ 纠正提示重试(1 次)
    ↓
执行操作(点击/滑动/输入/Intent/DPM/拍照/录屏/...)
    ↓
[2.5s] → 重新捕获屏幕  ←──────────────┐
    ↓                                   │
循环检测(同一操作连续 5 次?)             │
    ↓是→ 截图 + 视觉重试(最多 3 轮,15 次后停止)
    ↓否
任务完成?──否→ 继续循环
    ↓
是 → 结束

简单说就是:AI看屏幕 → 思考下一步 → 执行操作 → 看看效果 → 继续还是停下。形成闭环,不用你盯着。


支持的AI模型

官方文档里写的:

提供商
API格式
配置示例
Kimi
Anthropic Messages
Base URL: https://www.kimi.com/code/console,Model: kimi-k2.5
OpenAI兼容
OpenAI Chat Completions
Base URL: https://api.openai.com/v1,Model: gpt-4o

两个都支持多模态输入(文本 + 截图base64),可以携带图片。


环境要求

  • Android 12 (API 31) 或更高
  • 需要在设置里手动启用无障碍服务
  • 需要悬浮窗权限(显示紧急停止按钮)
  • 需要自己准备API Key(Kimi或OpenAI兼容)

安装方式

最简单的(推荐):用Chrome浏览器访问 andclaw.app/#/install,按提示走就行。

想自己编译的

  1. git clone https://github.com/andforce/Andclaw.git
  2. 创建 local.properties,配 kimi_key 和 tg_token(可选)
  3. ./gradlew :app:installDebug
  4. 打开App,按提示开无障碍服务和悬浮窗权限
  5. 可选:通过ADB激活Device Owner(adb shell dpm set-device-owner com.andforce.andclaw/.DeviceAdminReceiver

其他一些信息

  • 许可证:MIT(开源)
  • 技术栈:Java 89.4%、Kotlin 7.8%、TypeScript 2.2%
  • 致谢:TestDPC(Device Owner功能参考)、Kimi API


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅