微信扫码
添加专属顾问
我要投稿
这篇文章教你如何用OpenHands+Skills+iOS快捷指令,打造真正落地的业务自动化系统,让TikTok爆款分析变得简单高效。 核心内容: 1. 为什么Claude Code在业务侧是伪需求 2. 从刷视频到数据入库的完整闭环设计 3. 基于OpenHands的云端Skills系统实现方案
最近 Claude Skills 很火。
但我观察了一圈,发现大家都在陷入一种“开发者的自嗨”。
绝大多数 Skills 的应用场景都被死死锁在 IDE 里,锁在开发者的电脑前。
这叫开发提效,不叫业务提效。
真正的业务发生在移动端,发生在你通勤、吃饭、甚至躺在床上刷 TikTok 的时候。
如果你的 AI 能力必须打开电脑、输入命令行才能调用,那它的时空效率就是零。
于是我抛弃本地的 Claude Code,基于 OpenHands 做了一套云端 Skills 系统。
效果极其简单粗暴:
我在刷 TikTok,看到一个爆款视频,点击复制链接,敲击 iPhone 背面三下。
20 秒后,我的飞书多维表格里自动新增了一行数据。
这行数据包含了:这个视频的无水印文件、Gemini 拆解的镜头语言分析、爆款原因推导,以及一套可直接复用的 AI 视频生成提示词。
全过程我不需要打开电脑,不需要切换 APP,不需要等待。
这就是我今天要聊的:如何用 OpenHands + Skills + iOS 快捷指令,构建一套真正落地的业务自动化系统。
先厘清两个概念:OpenHands 和 Claude Code。
Claude Code 是 Anthropic 官方推出的命令行工具,它是一个嵌入在你本地终端里的结对程序员。它的 Skills 本质是上下文记忆和本地工具接口。
它的优势是懂你的代码规范,能直接改你电脑里的文件。
但它有一个对于业务场景的致命弱点:它必须依附于你的会话,你不在,它就不动。
它是一个副驾驶(Copilot)。
而 OpenHands(前身 OpenDevin)是一个开源的、自主的 AI 软件工程师。它运行在 Docker 容器里,是一个独立的服务端 Agent。
https://openhands.dev/
它是一个可以被封装成 API 服务的数字员工。
我看重 OpenHands 的核心理由只有一个:它可以 24 小时在线,并且可以通过 API 远程唤醒。
我做的这个 TikTok 分析系统,本质就是把 OpenHands 部署在服务器上,通过 FastAPI 暴露接口。
Claude Code 是给你用的工具;OpenHands 是你雇佣的、随时待命的员工。
小提示:FastAPI 的服务地址后加/docs就是文档了
对于做出海营销和短视频矩阵的朋友,拆解爆款是每天的必修课。
传统的流程极其反人类:
这个链路太长,断点太多。任何需要延迟满足的流程,最终都会变成不了了之。
我的远程 Skills 方案,把这个流程压缩到了极致。
整个逻辑是这样的:
利用 iOS 自带的快捷指令 + 背部轻点功能。
OpenHands 接收到请求后,自主执行以下 Skills:
1. Playwright Skill:
启动无头浏览器。这里有一个技术难点,TikTok 的反爬虫机制非常严格。如果用普通的 request 请求,成功率几乎为零。OpenHands 调用 Playwright 模拟真实浏览器行为,绕过 blob 协议,抓取真实的 MP4 视频流。这种方式的下载成功率稳定在 70%-80%
2. Gemini Skill:
视频下载后,调用Gemini 2.5 Flash,快且便宜。它不只是看,它是理解。它可以识别拍摄角度(俯拍/特写)、运镜方式(推拉摇移)、BGM 节奏点、色彩心理学。
3. Feishu Skill:
将清洗好的结构化数据(JSON),通过 API 写入飞书多维表格。
结果:
当你刷完半小时视频,打开飞书,几十个爆款视频的深度分析报告已经整整齐齐躺在那里了。
这才是 AI 赋能业务的本质:隐形化。
Openhands 的 Skills 文档:
https://docs.openhands.dev/sdk/guides/skill
这套架构的核心逻辑是:移动端触发 -> 服务端 API -> OpenHands 执行复杂 Skills -> 结果回传。
这个逻辑在出海业务里有无限的延展性。
我给几个具体的场景,你们可以拿去直接落地。
场景一:竞品独立站监控
场景二:亚马逊差评自动预警与回复草稿
场景三:广告素材批量生产
这是很多技术出身的朋友最容易陷入的误区。
你这个功能,我写个 Python 脚本 + 定时任务也能跑,为什么要搞这么复杂的 OpenHands Skills?
因为业务逻辑是流动的,而脚本是僵死的。
如果你写死了一个 Python 脚本:
但在 OpenHands Skills 的架构下,我们定义的不是步骤,而是目标。
在我的 Skill 定义里,我告诉 OpenHands:你的任务是下载这个页面上的视频,如果常规方法失败,尝试模拟用户滚动;如果还失败,检查是否有验证码并尝试通过。
OpenHands 作为一个 Agent,它具备自主决策和自我修复的能力。
在跨境出海这种平台规则朝令夕改的环境下,维护脚本的成本极高。
我们需要的是一个能够理解意图并自主寻找路径的智能体。
文章到这里,这套远程 Skills 系统的雏形已经搭建完毕。
但如果你觉得这就结束了,那你就小看了 Agentic Skills 的天花板。
我们现在的架构是“一个请求触发一个 Skill”,但这只是冰山一角。真正的威力在于 Multi-Skill Orchestration(多技能编排)。
OpenHands 的 Skill 本质是可执行的逻辑单元。我们可以像写代码一样,让 Skill A 去调用 Skill B。
你可以构建一个自我迭代的 Agent。让它先写一段代码(Coding Skill),然后自己运行测试(Testing Skill),如果报错,递归调用 Coding Skill 进行修复,直到测试通过。
2. 混合云架构(Hybrid Agent Architecture)
OpenHands 运行在 Docker 里,这意味着它可以部署在任何地方。
这样,通过 API 网关,你可以指挥内网的 Agent 去调用外网的 Agent,实现数据在安全域和互联网域之间的智能流转。
3. “人机回环”的异步交互
谁说 API 只有“请求-响应”这一种模式? 在我的系统中,有些复杂任务(如竞品深度调研)可能需要运行 30 分钟。
你点击确认后,Agent 继续执行。这才是真正的人机协作:AI 处理海量冗余信息,人类只在关键节点做决策。
在这个体系下,Skills 不再是静态的脚本,而是可生长、可组合的原子能力。
未来,你的个人服务器里可能运行着上百个这样的 Skills。它们是一群田螺姑娘,在你睡觉的时候,帮你监控市场、回复邮件、整理知识、优化代码。
而你,只需要握着手机,轻轻敲两下背部,就像魔法师挥动了魔杖。
这,才是 Agent 时代的真正玩法。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-04
Coding Agent 的最终形态是 TUI + GUI 吗?
2026-02-03
从 Clawdbot 看见个人 AI 助理元年的真正到来
2026-01-30
警惕!MoltBot 改名 OpenClaw:为什么你应该立即删除它?
2026-01-30
Vue 核心成员 Anthony Fu 发布了他的 Vue skills,这不就来了!
2026-01-29
飞牛OS | 相遇clawdbot,让小龙虾接管飞牛充当贾维斯
2026-01-29
不只PPT,Kimi K2.5 Agent可以帮你做Excel、Word和PDF了
2026-01-28
Clawdbot是什么?小白可以学习的技术概念指南
2026-01-28
一个Skill复用无数次:Manus如何用开放标准重新定义agent能力扩展
2026-01-24
2026-01-08
2026-01-30
2026-01-18
2025-12-10
2025-12-04
2026-01-29
2026-01-27
2026-01-21
2025-12-14
2026-02-04
2026-01-30
2026-01-21
2026-01-18
2025-12-25
2025-12-10
2025-12-09
2025-12-04