微信扫码
添加专属顾问
我要投稿
探索智能体到用户交互协议(AG-UI)的创新解决方案。 核心内容: 1. AG-UI协议的必要性和背景介绍 2. AG-UI协议解决的智能体工具包集成问题 3. AG-UI协议技术细节与SDK支持
1智能体到用户交互(AG-UI)协议
1. MCP 标准化了Agent 到Tool 之间通信。
2. A2A(Agent2Agent )协议标准化了Agent 到Agent 通信。
但仍然缺少一块......
这就是智能体到用户通信的协议:
让我们了解为什么这很重要。
今天,我们可以使用LangGraph、CrewAI、Mastra 、dify、AutoGen、Hiagent(字节)等智能体工具工具包构建强大的多步骤智能体工作流。
但是,当您尝试将该Agent 引入实际应用程序时,事情就崩溃了:
1.您希望逐个Token流式传输LLM 响应,而无需构建自定义WebSocket 服务器。
2.您希望在工具执行进度发生时显示它,暂停以获得人工反馈,而不会阻塞或丢失上下文。
3.您希望同步大型、不断变化的对象(如代码或表格),而无需将所有内容重新发送到UI。
4.您希望让用户在智能体运行中中断、取消或回复,而不会丢失上下文。
这是另一个问题:
每个智能体后端都有自己的工具调用、ReAct 样式规划、状态差异和输出格式机制。
所以如果你使用LangGraph,前端将实现自定义的WebSocket 逻辑、杂乱的JSON 格式和特定于LangGraph 的UI 适配器。
但要迁移到CrewAI/Dify等,一切都必须进行调整。
这不会缩放。
AG-UI(智能体-用户交互协议)是CopilotKit 推出的开源协议,可解决此问题。
它标准化了后端智能体和前端UI 之间的交互层(下面的绿色层)。
可以这样想:
1.就像REST 是客户端到服务器请求的标准一样......
2.AG-UI 是将实时智能体更新流式传输回UI 的标准。
从技术上讲......
它使用服务器发送事件(SSE)将结构化JSON 事件流式传输到前端。
每个事件都有一个显式的有效负载(如Python 字典中的keys),例如:
1.TEXT_MESSAGE_CONTENT用于令牌流式处理。
2.TOOL_CALL_START以显示工具执行情况。
3.STATE_DELTA更新共享状态(代码、数据等)
4.AGENT_HANDOFF在智能体之间顺利传递控制权
并且它带有TypeScript 和Python 的SDK,使这种即插即用适用于任何堆栈,如下所示: |
在上图中,来自Agent 的响应并不特定于任何工具包。这是一个标准化的AG-UI 响应。
这意味着您需要编写一次后端逻辑并将其挂接到AG-UI 中,一切正常:
1.LangGraph、CrewAI、Mastra — 都可以发出AG-UI 事件。
2.可以使用CopilotKit 组件或您自己的React 堆栈构建UI。
3.您可以在本地将GPT-4 交换为Llama-3/DeepSeek V3,而无需更改前端中的任何内容。
这是让您的Agent 应用程序感觉像真实软件的层,而不仅仅是美化的聊天机器人。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-09-03
10分钟零代码,0元立即部署OpenAI开源模型 GPT-OSS
2025-09-03
coze开源能力及与官方闭源版比较
2025-09-03
工业级AI平台开源,识别率超过99%,包含图像采集、智能检测、数据标注、模型训练四大模块
2025-09-02
Coze教程 | 第2章:Coze开发环境搭建与配置
2025-09-01
谁才是企业级开源平台的优选?OpenCSG与Dify、Coze、Langflow、Ollama 的差异化之路
2025-09-01
苹果深夜开源FastVLM:速度飙升85倍,0.5B小模型要逼疯谁?
2025-09-01
美团正式发布并开源 LongCat-Flash-Chat,动态计算开启高效 AI 时代
2025-09-01
突发,美团推出 560B 开源模型,名为长猫
2025-07-23
2025-06-17
2025-08-20
2025-06-17
2025-07-23
2025-08-05
2025-07-14
2025-08-20
2025-07-29
2025-07-12
2025-09-01
2025-08-16
2025-08-13
2025-08-11
2025-08-11
2025-08-06
2025-08-06
2025-08-06