微信扫码
添加专属顾问
我要投稿
探索智能体到用户交互协议(AG-UI)的创新解决方案。 核心内容: 1. AG-UI协议的必要性和背景介绍 2. AG-UI协议解决的智能体工具包集成问题 3. AG-UI协议技术细节与SDK支持
1智能体到用户交互(AG-UI)协议
1. MCP 标准化了Agent 到Tool 之间通信。
2. A2A(Agent2Agent )协议标准化了Agent 到Agent 通信。
但仍然缺少一块......
这就是智能体到用户通信的协议:
让我们了解为什么这很重要。
今天,我们可以使用LangGraph、CrewAI、Mastra 、dify、AutoGen、Hiagent(字节)等智能体工具工具包构建强大的多步骤智能体工作流。
但是,当您尝试将该Agent 引入实际应用程序时,事情就崩溃了:
1.您希望逐个Token流式传输LLM 响应,而无需构建自定义WebSocket 服务器。
2.您希望在工具执行进度发生时显示它,暂停以获得人工反馈,而不会阻塞或丢失上下文。
3.您希望同步大型、不断变化的对象(如代码或表格),而无需将所有内容重新发送到UI。
4.您希望让用户在智能体运行中中断、取消或回复,而不会丢失上下文。
这是另一个问题:
每个智能体后端都有自己的工具调用、ReAct 样式规划、状态差异和输出格式机制。
所以如果你使用LangGraph,前端将实现自定义的WebSocket 逻辑、杂乱的JSON 格式和特定于LangGraph 的UI 适配器。
但要迁移到CrewAI/Dify等,一切都必须进行调整。
这不会缩放。
AG-UI(智能体-用户交互协议)是CopilotKit 推出的开源协议,可解决此问题。
它标准化了后端智能体和前端UI 之间的交互层(下面的绿色层)。
可以这样想:
1.就像REST 是客户端到服务器请求的标准一样......
2.AG-UI 是将实时智能体更新流式传输回UI 的标准。
从技术上讲......
它使用服务器发送事件(SSE)将结构化JSON 事件流式传输到前端。
每个事件都有一个显式的有效负载(如Python 字典中的keys),例如:
1.TEXT_MESSAGE_CONTENT用于令牌流式处理。
2.TOOL_CALL_START以显示工具执行情况。
3.STATE_DELTA更新共享状态(代码、数据等)
4.AGENT_HANDOFF在智能体之间顺利传递控制权
并且它带有TypeScript 和Python 的SDK,使这种即插即用适用于任何堆栈,如下所示: |
在上图中,来自Agent 的响应并不特定于任何工具包。这是一个标准化的AG-UI 响应。
这意味着您需要编写一次后端逻辑并将其挂接到AG-UI 中,一切正常:
1.LangGraph、CrewAI、Mastra — 都可以发出AG-UI 事件。
2.可以使用CopilotKit 组件或您自己的React 堆栈构建UI。
3.您可以在本地将GPT-4 交换为Llama-3/DeepSeek V3,而无需更改前端中的任何内容。
这是让您的Agent 应用程序感觉像真实软件的层,而不仅仅是美化的聊天机器人。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-03
Claude Code——智能路由与切换工具
2026-02-03
作为投资方,我们试了试Kimi K2.5
2026-02-03
暴涨11.7k Star!复刻Manus上下文工程的开源Skills,Claude code等多个平台即插即用
2026-02-03
ollama v0.15.4 更新:OpenClaw全面上线,优化集成流程与工具解析能力大升级!
2026-02-03
阶跃星辰 Step 3.5 Flash 上线!更快更强更稳的 Agent 大脑,开源!
2026-02-02
一分钟部署OpenClaw+QQ,国内最爽的一键启动!
2026-02-02
这家字节系AI初创,推出首个开源Agent Skills Builder!对话Refly.AI李锦威:大多数Agent都停留在专业用户层面,没有做到真正的普惠
2026-02-02
OCR又出宠OpenDoc,速度超MinerU6倍
2025-11-19
2026-01-27
2025-12-22
2025-12-10
2025-11-17
2026-01-12
2025-11-07
2025-12-23
2026-01-29
2026-01-06
2026-01-28
2026-01-26
2026-01-21
2026-01-21
2026-01-20
2026-01-16
2026-01-02
2025-12-24