AI Agent崛起：手机操作系统的智能未来

发布日期：2025-02-21 08:20:44 浏览次数： 2821

作者：卜一定

微信搜一搜，关注“卜一定”

一、AI 手机发展背景

非 AI 与智能机时代痛点：非 AI 时代，用户被淹没到系统生态之中，用户需要承担大量的记忆负担。从功能机简单（对比如今其实是简陋）到复杂的智能机时代，庞杂的功能及服务如海啸般涌向消费者，手机厂商绞尽脑汁为消费者开发出很多实用但不常用甚至不曾开启的功能，一个重要的原因就是缺乏服务设计与用户场景自动连接的桥梁。在智能机时代，大部分的功能还是依赖简单的机器学习算法规则来实现信息检索和判断，处于一个低维度的功能实现。

二、AI 手机核心概念

AI 对手机交互的变革：随着 AI 这几年的爆发发展，这一痛点需求会得到史无前例的满足。AI 将成为手机与用户之间交互的交通枢纽。AI 手机发展路径，从本地化 AI 功能面向服务生态化迈进，利用 Agent 能力像八爪鱼一样伸向四面八方。

AI 手机核心：Agent 与服务生态融合，手机操作系统从去中心化回到了以 AI 为核心的中心化系统，例如以苹果的语音助手 Siri、三星的语音助手 Bixby 为中心，用户通过多模态输入，进行基本的本地功能调用，生成式回答。

AI Agent 核心能力 - 自动化功能：AI Agent 的核心能力就是自动化功能，可以缩短用户的交互路径。在传统操作系统下，新建一个约会吃饭的日程，需要打开日历 APP，填写信息，分享日程，打开微信，选择联系人，发送。在实际的操作中，很有可能会被其他的操作障碍给中断，交互效率比较低下。在 AI 赋能的情况下，只需要语音输入信息，AI 根据历史信息进行信息补全，所有动作都会在后台静默完成，在重要的核心交互接触点进行用户告知。这样的 Use case 会遍布整个用户使用系统之中。在有关人们的衣食住行和个人事务安排方面，已经有人在践行，比如 Brain AI 和罗友浩老师的 J1Assistant。

AI 对手机操作系统技术生态的改变：AI agent 的引入，将会彻底改变手机操作系统的运作技术生态。在信息整合，搜索，筛选等方面，将会更加智能精准，比如通知，邮件，短信等垃圾信息等过滤将会变得异常精准，利于监督学习，将信息作分类，优先级排序等处理，语义和意图识别加上用户的动态信息（位置，时间，交互反馈）实现更加准确的个性化处理信息。

三、具体 AI 手机产品实例 - J1Assistant

J1Assistant 整体情况：J1Assistant 是以罗永浩为核心，以它为基准点连接多设备，构成一个完整的 AI OS 生态群。初版的体验不尽人意，集成了 Google ，ChatGPT，Perplexity 的信息工具，在功能上实现代办，备忘，日程。

J1Assistant 框架设计与功能覆盖：J1Assistant 在基础框架设计上就是直接冲着要打造一个自我闭环的 AI 助理的 OS 系统，具备代办，备忘，应用内短信社交，信息搜索，Chatbot 等功能。基本覆盖了用户在搜索数据和生成数据的大部分场景，因为具有偶像包袱，整个助手继承了锤子系统的 GUI 和交互逻辑，尤其是备忘子系统，锤子便签至今用户活跃度不错。

J1Assistant 当前整合度与问题：目前的整合度还处于一个初步验证阶段，用户输入特定的指令能够较为准确的分清任务，比如明确指令生成代办或者便签，系统能准确生成对应的结果。我用的是第一个版本，随着用户量的沉淀和反馈，系统会进行一定程度的调优，目前交互入口过于庞杂，对用户的交互链路会产生回挫。

J1Assistant 搜索模块拓展：在搜索模块，我们可以看到助手伸向了各个领域的信息检索，Google，X，Reddit 等不同的领域分支，还延伸到电子购物。我认为这都是从信息层作为切入口，将来肯定会深入到具体的 AI agent 任务，不单单只做一个信息检索工具。

目前罗老师的助手受限于研发成本和历史原因，多项功能处于半自动化状态，随着大模型能力提升，有望让模型自行识别用户意图并进行推理，自动化给出用户想要的结果。

四、手机厂商与大模型的合作

手机厂商与大模型合作趋势：最近苹果与阿里达成非排他性协议合作，三星与智普达成深度合作协议给大模型厂商带来极大的虹吸效应。过去一年，阿里、百度、讯飞、腾讯、智普与国内手机大厂都没有达成非常深度的合作。相反，世界最大的两家手机品牌选择了国内模型大厂的深度合作，因海外品牌自研适应国内本土的大模型难度大，相信苹果与三星在国内大模型成功落地得到市场正向反馈后，国内手机品牌会持续跟进，甚至走出海外。

苹果与阿里合作详情：根据最新消息，苹果与阿里巴巴的合作聚焦电商与生活服务：
购物体验优化：结合阿里电商生态，为用户提供更智能的购物推荐和搜索功能。
生活服务接入：可能会通过 AI 助手接入更多本地生活服务，如外卖、打车、支付等。
这个合作将助力苹果完善国内手机系统工具和服务体系的整合。强强联合将拉开与其他厂商的距离，为其他厂牌提供样板。AI 驱动是连接枢纽，没有 AI 驱动，很多服务无法打通。

三星与智谱合作及相关产品功能：同样，三星 Galaxy S25 借助智谱 Agentic GLM 的能力，「语聊视界」支持以 FunctionCall 方式，通过语音对系统级功能进行调用，可进行日程、出行路线规划等一系列个人助理的个性化使用场景拓展。

五、Deepseek 模型分析及应用

Deepseek 的影响力与跟进情况：Deepseek 现象级走红，从海外红到国内，给手机厂商集成 Deepseek 模型做了极大的背书，华为、荣耀、OPPO、魅族、VIVO 都快速跟进。未来带着 Deepseek 走向海外颇具可能性，老罗的 AI assistant 研发团队也可能在积极跟进集成 Deepseek。

DeepSeek V3 性能分析：DeepSeek V3 在较难的学术和阅读理解类测试（如 MMLU, DROP, MMLU-Redux）表现突出，甚至超越 GPT-4o 和 Claude-3.5。在代码相关任务（如 Codeforces, LiveCodeBench）和部分如 SimpleQA 的表现相对较弱。整体而言，它在语言理解、推理、数学等高难度任务上处于领先水平，但在部分开放域问答任务中仍有改进空间。比如对比 Deepseek v3 与 GPT-4o：

SimpleQA (Correct)：GPT-4o 领先 13.3，表明在基础开放问答场景（例如用户提问 - 直接回答），GPT-4o 更精准。
FRAMES (Acc.)：GPT-4o 领先 7.2，表示在多轮对话场景中，GPT-4o 更稳定。

对于手机 AI OS 系统来讲，开放领域问答使用场景较多，例如信息查询（搜索引擎、新闻、百科）、社交交流（短信、社交媒体、即时通讯）、娱乐（音乐、视频、游戏）、生活服务（导航、外卖、购物、支付）、AI 助手（Siri、Google Assistant、小爱同学等）。但在目前的开源模型领域中，DeepSeek 在真实的手机 AI OS 用户使用场景下能够满足需求，与小爱同学所使用的模型进行横向对比时，DeepSeek 具有碾压式的优势。

DeepSeek 模型尺寸与应用情况：只讲模型尺寸不讲实际场景应用是不行的，DeepSeek-R1 系列模型的参数规模从 1.5 亿（1.5B）到 6710 亿（671B）不等，其中最大模型为 6710 亿参数。相比之下，小米自研的大模型 MiLM 主要有 13 亿（1.3B）和 64 亿（6B）参数两个版本，小米在场景优化、本地部署方面做了很多优化工作。短期内 DeepSeek 作为本地模型部署到手机端有距离，目前有些大厂牌将 Deepseek 作为智能体入口放置到手机助手，也有类似 Oppo 某些旗舰产品将满血版 deepseek 深入集成到助手，可直接语音唤起使用。

手机厂商应用 DeepSeek 的策略困境：一个手机厂牌的产品线覆盖从低端到旗舰高端多种机型，希望 AIOS 系统覆盖所有机型，但存在矛盾短期内无法调和。虽有 DeepSeek 这样开源性能强劲的模型问世，低端机型想要 AI 赋能，只能在低硬件配置基础上采用现成的云 API + 规则匹配方式完成，随时间推移，成本累加，收益递减。所以目前厂商大多采用旗舰机 + 数据集 + 模型优化的策略打造 AIOS。虽前期投入大，但后期成本降低，旗舰机高溢价可覆盖部分本地模型训练成本投入。

总结，随着模型能力的不断提升以及应用场景的持续拓展，AI 操作系统（AIOS）的发展演变进程将进一步加快。AI 带来的价值远不止是赋予用户自动化操作的能力，更为关键的是，它极大地增强了用户解决问题的实际能力，使用户能够在省时省力的前提下，以高效的方式完成那些以往需要耗费大量精力才能达成的任务，显著提升了用户体验与生活、工作效率。模型价格和体积的缩小，相信会普惠到更多的用户群里。