免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


当我们谈论“AI原生”时我们在谈论什么?

发布日期:2025-09-06 03:24:02 浏览次数: 1529
作者:未来考古学

微信搜一搜,关注“未来考古学”

推荐语

AI原生时代:从工具操作员到智能代理管理者的转变,探索人机协作的全新范式。

核心内容:
1. AI原生概念的本质:从确定性执行到概率性协作的范式转移
2. 1997年历史性辩论:直接操纵 vs 界面代理,及其在LLM时代的融合
3. 用户心智模型的重构:从"执行的鸿沟"到"评估的鸿沟"的认知转变

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

AI原生:一场从确定性执行到概率性协作的范式转移

当我们谈论“AI原生”时,我们究竟在讨论什么?

是又一个聊天框?是把GPT塞进每个产品?还是让所有界面都能对话?

都不是。

我们正在经历的,是人机交互(HCI)历史上最深刻的范式转移——从命令驱动的确定性执行,转向意图驱动的概率性协作。这并非简单的界面演进,而是人与技术关系的根本性重构。我们正从工具的操作员,转变为智能代理的管理者,这是一个充满机遇但也潜藏风险的全新时代。

一场跨越26年的历史性辩论

要理解今天的变革,我们必须回到1997年。

那一年,在人机交互顶级会议CHI上,马里兰大学的Ben Shneiderman与MIT的Pattie Maes进行了一场载入史册的辩论。Shneiderman作为“直接操纵”(Direct Manipulation)理念的旗手,坚信用户应当是可预测工具的自信掌控者。他所倡导的世界由可见的对象、即时的反馈和可逆的操作构成,用户通过FilmFinder等信息可视化系统,在数千个数据点中轻松发现模式,保持着绝对的控制权。这种理念塑造了我们至今仍在使用的图形用户界面(GUI):菜单、按钮、拖拽、所见即所得。

而Maes则提出了一个截然不同的未来——“界面代理”(Interface Agents)。她预见到,随着信息复杂度的指数级增长,要求用户事无巨细地操控每个细节将变得不可持续。她通过其实验室的Firefly音乐推荐系统等项目,倡导一种新的协作模式:用户成为战略管理者,设定目标、监督过程,而将繁琐的执行委托给能够学习和适应的智能助手 。

26年后的今天,大型语言模型(LLM)的出现,终于为这场辩论写下了新的一章。答案并非一方压倒另一方,而是两者的动态融合。Maes在总结中强调“用户的理解是核心,用户的控制对成功至关重要”,而Shneiderman也承认代理在特定场景下的价值。他们共同预言的,是一个被称为“混合主导交互”(Mixed-Initiative Interaction)的未来,即控制权不再是固定的,而是在人与AI之间根据情境、任务和信任程度动态协商 。

心智模型的颠覆:从弥合“执行的鸿沟”到跨越“评估的鸿沟”

这场转变最深刻的影响,体现在用户心智模型的根本性重构上,而唐纳德·诺曼的认知科学理论为我们提供了有力的解释框架。

在GUI时代,我们建立的心智模型是:我是工具的操作员。点击保存按钮,文件一定会被保存。这是一个确定性的世界。GUI设计的黄金法则是弥合诺曼所说的“执行的鸿沟”(Gulf of Execution)——即用户意图与系统允许的操作之间的差距。WYSIWYG编辑器、图标和菜单,都是为了让用户能够更轻松、更直观地执行操作

而在AI原生时代,心智模型转变为:我是代理的管理者。我说“帮我整理这份报告”,AI会理解意图、制定计划、执行任务。但具体如何整理、采用什么结构,都带有概率性和创造性。这是一个协作的、涌现的世界。自然语言交互几乎完全消除了“执行的鸿沟”,但它同时创造了一个全新的、可能更宽的“评估的鸿沟”(Gulf of Evaluation)——即系统输出与用户理解、验证该输出的能力之间的差距。

用户的认知任务,从“如何做?”转向了“做得怎么样?”。诺曼的七阶段行动模型在这里被彻底重构:中间的“确定执行序列”和“执行动作”被大量委托给AI,人类的认知焦点则转移到“形成目标”和“评估结果”这两个首尾环节 。

为了更清晰地阐明这一转变的广度和深度,下表从多个维度对比了两种范式下的用户体验:

维度
GUI范式 (确定性执行)
AI原生范式 (概率性协作)
用户角色
自信的操作员
战略管理者 / 总监
核心交互
直接操纵 (点击、拖拽、输入)
意图表达 (自然语言、目标)
系统行为
可预测、可逆、固定
概率性、涌现性、自适应
用户认知任务
程序性记忆 (“我该如何操作?”)
批判性判断 (“这是我想要的吗?”)
信任基础
可靠性 (它总能做同样的事)
可验证性 (它能展示它的工作过程)
核心隐喻
一个组织精良的工具箱
一位积极主动、才华横溢的实习生

今日的设计语言:认知委托的不同层次

这种心智模型的转变,催生了业界的三种核心交互模式。它们不仅是UI布局的选择,更是用户在不同情境下愿意委托认知努力和让渡控制权的物理体现。

1. 沉浸式画布模式(Immersive Canvas):最大程度的委托

当任务复杂、高风险且需要深度专注时,全屏画布成为人机协作的主舞台。从ChatGPT Canvas到Microsoft Security Copilot,这种模式的本质是为深度工作创造专属空间。用户在此进入一个以协作为主的全新环境,将大部分执行过程委托给AI,自己则专注于战略引导和结果评估。

2. 助理式边栏模式(Assistive Sidecar):部分委托

当用户需要保持在主工作流中,同时获得AI增强时,边栏成为最佳选择。无论是Coding Copilot还是Comet浏览器,这种模式的精髓是不打断,而是增强。用户维持其主要工作流,AI作为随时待命的助手,在独立的持久空间中提供帮助,实现了人机之间的部分任务委托。

3. 嵌入式内联模式(Embedded Inline):最低程度的委托

对于微交互和局部增强,内联模式提供了最小摩擦的体验。从Gmail的“Help me write”到Snipd的“Create Snip”,AI能力被编织进具体的操作点。用户完全掌控其主要任务,仅在微任务上调用AI,实现了最低程度的认知委托。AI在此更像一个工具,而非伙伴。

下一个前沿:当界面本身成为AI

如果说上述三种模式是将AI整合进现有的界面结构中,那么正在兴起的下一波浪潮则更为激进和颠覆:它探索的是一个界面本身就是AI的动态输出的未来。

1. 意图驱动界面 (Intent-Driven Interface)

这一范式旨在实现AI原生交互的终极承诺:用户只需用自然语言表达一个高层级的目标,而无需下达任何具体指令,AI将自主负责后续所有环节。用户定义“做什么”(the what),AI则完全接管“如何做”(the how)。

这一理念的种子可以追溯到Ubuntu的Head-Up Display (HUD)等早期探索,它允许用户通过搜索来执行菜单命令,初步实现了从“点击”到“意图”的转变。而今,在一些前沿的AI驱动操作系统设计中,这一愿景正变得更加宏大——系统试图通过多模态上下文理解用户的综合意图,主动地将不同服务和应用串联起来以完成复杂任务。

这背后隐藏着一个根本性的结构变化:意图与实现的解耦。在传统软件中,用户的意图(如“保存文件”)与具体的实现方式(点击“文件”菜单下的“保存”按钮)是紧密耦合的。而意图驱动界面则打破了这种耦合。其深远影响在于,应用程序的定义被重塑了。它们不再是用户直接交互的前台,而是变成了一个个可供更上层的“意图引擎”调度的能力集合(APIs、工具)。未来的竞争优势将不再取决于单个应用的功能多寡,而在于谁能构建最智能、最可靠的意图编排层。

2. 生成式用户界面 (Generative UI)

这一模式下,用户界面不再是一个由设计师和工程师预先编码的静态、固定的产物。相反,它是由AI根据当前的用户、任务和上下文,在交互的瞬间实时生成。界面本身,成为了AI输出的另一种模态,像文本或图像一样流畅和动态。

设计和工程团队的工作重心,从绘制和构建每一个像素完美的静态界面,转向了定义一个强大而灵活的“设计系统2.0”。这个系统包含了一套丰富的UI组件库、设计原则(design tokens)和布局约束。团队的任务,是为AI提供一套高质量的“乐高积木”,并教会它如何根据用户意图有意义地、合乎美学地将它们组装起来。

这一转变将直接导致A/B测试的消亡与N-of-1界面的兴起。在生成式UI的世界里,不再有固定的“版本A”或“版本B”,取而代之的是为每一个用户在每一个特定时刻量身定制的、可能无限的界面版本。优化的目标不再是寻找适用于所有人的“最优解”,而是让AI学习并适应每一个独立个体的偏好、认知风格和当前需求,从而为“这一个人,在这一刻”生成最有效的界面。这种定制基于用户历史行为数据的锁定,将形成强大的护城河。

3. LLM驱动的GUI代理

它利用多模态大型语言模型的能力,让AI能够像人类一样“看懂”并操作传统的图形用户界面。AI通过视觉识别屏幕上的按钮、表单、菜单和文本,然后模拟鼠标点击和键盘输入来完成任务。

它允许我们将先进的意图驱动交互,叠加在庞大的、无法轻易改造的存量软件生态之上,这完美地解决了企业自动化和个人助理在面对无数传统软件时的“冷启动”难题。

其更深层的战略影响在于应用层的商品化。目前,一个SaaS产品的核心价值在于其独特的功能、工作流和用户界面,用户被锁定在其生态系统内。一个足够强大的GUI代理则在所有这些应用之上创建了一个新的抽象层。在这种情况下,用户的忠诚度将从底层的各个应用,转移到这个无所不能的代理本身。真正的竞争主战场,将不再是单个应用的功能列表,而是代理的智能、可靠性和生态整合能力。这对于那些未能构建起自己的主导代理层的现有软件巨头而言,无疑构成了生存级别的挑战。

新的认知工程:从降低负荷到培育判断

过去的认知负荷主要是外在的(Extrinsic Load),即与任务本身无关、纯粹由使用界面所带来的“界面税”,例如记忆菜单项的位置、学习复杂的快捷键、理解晦涩的图标。LLM通过自然语言交互,几乎可以完全消除这类认知负荷。

但这并不意味着认知负荷的终结,一种新的、更为内在的(Intrinsic Load)认知负荷正在浮现,并成为人机协作的核心:

  • 意图阐述:我如何才能清晰、无歧义地向AI表达我真正想要什么?

  • 信任校准:AI给出的建议有多大可信度?哪些部分需要我亲自验证?

  • 结果评估:AI生成的内容质量如何?是否达到了我的预期标准?

  • 边界感知:在协作过程中,什么时候我应该介入干预?什么时候又应该放手让AI自主发挥?

同时,一个更严峻的挑战随之而来:自动化偏见(Automation Bias)。这是指人类倾向于过度依赖自动化系统,即便其输出与常识相悖,也依然选择相信。这可能导致灾难性的执行错误(因为AI的建议而做了错事)和疏忽错误(因为AI未发出警报而未能采取行动)。

法航447航班的空难便是一个惨痛的教训,飞行员对自动化系统的过度依赖,导致他们在紧急情况下失去了手动操控飞机的能力。长期的过度依赖还会导致“自动化自满”和“去技能化”(Automation Complacency & De-skilling),即用户的警惕性下降,自身专业技能也随之退化。

因此,优秀的设计需要刻意保留某些“建设性摩擦”。在关键决策点要求用户确认,在复杂任务中展示推理过程——这些设计不仅是为了提升用户的控制感,更是为了缓解自动化偏见、让用户的批判性思维保持“在线”的关键安全策略。

信任算法:从确定性到可验证性

在概率性系统中,信任是最大的挑战。当输出不再100%确定时,用户凭什么相信AI?答案不是让AI变得完美(这不可能),而是让它变得透明和可验证

  • 证据链默认开启:每个输出都附带来源、引用和推理过程。

  • 置信度可视化:明确告知“我有80%的把握”与“这是确定的事实”之间的区别。

  • 过程透明化:向用户展示“正在搜索资料...正在分析数据...”等中间步骤。

  • 人类把关点:在关键决策处刻意引入“建设性摩擦”,强制人类审核。

LLM解锁三大新问题空间

最激动人心的是LLM可以打开新的产品化空间:

1. 高层意图的智能分解(AI即总承包商)

“帮我规划一场产品发布会”——这种需求在过去只能求助于人类顾问。LLM作为“智能编排器”,首次让这类问题可以产品化。它能将战略目标分解为战术行动,将模糊意图转化为具体步骤。

2. 开放性探索的产品化 (AI即思辨伙伴)

研究、创作、探索——这些没有明确终点的活动,过去很难被标准化为产品。LLM通过提供一个能够进行高质量人机共创对话的环境,让这些开放性问题拥有了产品化的载体。例如,NotebookLM并非直接给你一个研究报告,而是成为你的研究伙伴,与你一同阅读材料、发现联系、激发思考。ChatGPT Canvas也不是简单地生成一篇文章,而是与你共同进行头脑风暴、搭建框架、反复修改。在这些产品中,交付的不再是固定的功能,而是一个动态的、可赋能的创造过程。

3. 成熟流程的理解力增强 (AI即语义层)

CRM系统可以记录每一次客户通话,但理解不了客户在通话中表达的真实情绪;代码编辑器可以检查语法错误,但理解不了这段代码的商业逻辑。

LLM的嵌入,为这些成熟的工具注入了一层宝贵的“语义理解层”。现在,CRM可以自动总结客户的核心诉求和情绪变化;IDE可以解释一段复杂代码的意图和潜在风险;商业智能(BI)工具不仅能展示数据图表,更能用自然语言讲述数据背后的商业故事。这并非要替代原有的核心功能,而是在每一个环节都增加了一层“理解”的维度,从而极大地提升了信息的价值密度和用户的决策效率。

对产品团队影响:角色的重塑

这场范式转移正在彻底重塑产品开发的每个角色。

开发者:工作重心从编写确定性的前端组件,转向设计和约束一个概率性的后端系统。他们不再是“界面实现者”,而是AI可操作世界的架构师。他们的核心任务变成了定义AI可用的工具集、撰写指导其行为的“章程”(constitution),以及为非确定性代理构建强大的评估和测试框架 。

设计师:角色从“界面建筑师”演变为“体验编排师与伦理工程师”。他们设计的不再是固定的流程,而是一个充满可能性的空间。更重要的是,考虑到自动化偏见的风险,设计师必须承担起伦理责任,通过创造必要的“建设性摩擦”来保障人机协作的安全,确保用户在享受便利的同时,不会丧失批判性思维和最终控制权 。

产品经理:竞争优势的定义被彻底改写。功能列表不再重要,因为AI可以快速复制任何功能。真正的护城河变成了:1)AI的编排能力;2)数据的独特性和飞轮效应;3)人机协作的流畅度。产品经理的角色从战术执行者,提升为管理一个智能学习系统的战略家,更专注于愿景、用户共情和风险管理 。

结语:一个混合主导的新时代

未来不是AI取代人类,也不是人类控制AI,而是两者的动态融合。

想象这样的工作流:你用自然语言描述想要的演示文稿主题(委托模式)→ AI生成初稿 → 你切换到直接操纵模式精调某一页的设计 → 再用语言指令批量应用样式(委托模式)。在这个流程中,控制权像接力棒一样在人与AI之间无缝传递。

我们正站在一个历史性的转折点上。这场从确定性执行到概率性协作的范式转移,不仅改变了我们与技术交互的方式,更重新定义了人类在数字时代的角色。我们不再需要适应机器的语言,机器开始理解我们的意图。

技术的进步为我们打开了新的设计空间,但如何在效率与控制、自动化与人性、智能与信任之间找到平衡,将决定这个AI原生时代最终的模样。这不仅是产品设计的革命,更是我们与数字世界关系的一次文明级演进。而我们,正是这场演进的见证者和塑造者。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询