微信扫码
添加专属顾问
 
                        我要投稿
深入剖析MCP协议,揭示AI巨头在工程实践上的短板。 核心内容: 1. MCP协议定义与标准化LLM交互的重要性 2. MCP的突然爆火及其在AI领域的影响 3. MCP三种传输方式的复杂性与问题剖析
 
                                
昨天在给团队实现一个基于大模型的智能编码助手时,我遇到了一个关键问题:如何让LLM能够与我们的代码库、数据库和开发工具交互?当我深入研究Anthropic主导的MCP(Model Context Protocol)后,不禁感到困惑:为什么这些能在模型训练上投入数十亿美元的AI巨头,在工程实践上却如此粗糙?
MCP本质上是一个开放协议,用于标准化应用程序如何向LLM提供上下文。用Anthropic的话说,它就像是AI应用的"USB-C接口",提供标准化方式让AI模型连接不同的数据源和工具。
过去一个月,MCP突然爆火,成为让LLM变身为"智能体"并与世界交互的关键技术。同时,IBM推出了Agent Communication Protocol (ACP),Google紧随其后发布了Agent2Agent (A2A)。各大厂商争相布局,MCP的服务器和客户端实现每天都在涌现,可以在mcp.so和pulsemcp.com等网站上找到。
从本质上讲,MCP是一个预定义了方法/端点的JSON-RPC协议,设计用于与LLM配合使用。这部分设计相对简单清晰,但真正的问题在于它的传输层实现。
MCP支持三种主要的传输方式:
stdio方式很直接:启动本地MCP服务器,连接stdout和stdin管道,开始发送JSON数据,使用stderr进行日志记录。虽然这种方式打破了Unix/Linux管道范式,但它简单、易理解,在所有操作系统上都能直接工作。
HTTP传输则令人头疼。在HTTP+SSE模式中,为实现全双工通信,客户端首先建立SSE会话(如GET /sse)用于读取数据。第一次读取会提供一个URL,客户端向该URL发送写请求(如POST /a-endpoint?session-id=1234。
更复杂的是所谓的"Streamable HTTP"模式,它试图改进HTTP+SSE,但实际上增加了更多复杂性:
创建新会话的三种方式:
GET请求POST请求POST请求打开SSE连接的四种方式:
GETGETPOSTPOST请求可能通过三种不同方式得到回答:
POST的HTTP响应POST RPC调用而打开的SSE中的事件这种设计复杂性带来了严重的问题:
// 示例:处理不同类型的会话创建请求
functionhandleRequest(req) {
if (req.method === 'GET' && !req.headers['mcp-session-id']) {
    // 创建新会话,返回SSE流
    returncreateNewSession(req);
  } elseif (req.method === 'POST' && !req.headers['mcp-session-id']) {
    if (req.body && Object.keys(req.body).length > 0) {
      // 创建新会话并处理RPC调用
      returncreateSessionAndHandleRPC(req);
    } else {
      // 创建空会话
      returncreateNewSession(req);
    }
  } elseif (req.headers['mcp-session-id']) {
    // 处理现有会话的请求
    returnhandleExistingSession(req);
  }
}面对这种过度复杂的设计,一个明显的问题是:为什么不直接使用WebSockets[1]?
让我们比较不同传输方式的优缺点:
WebSockets是HTTP上实现类似stdio行为的自然选择:
"Streamable HTTP"的设计引入了几个安全问题:
如果你决定在项目中使用MCP,我建议:
下面是一个使用WebSockets实现MCP的简单示例:
// 使用WebSockets实现MCP客户端的简化示例
const ws = newWebSocket('ws://mcp-server.example.com/mcp');
ws.onopen = () => {
// 发送MCP请求
  ws.send(JSON.stringify({
    jsonrpc: '2.0',
    id: '1',
    method: 'file.read',
    params: {
      path: '/path/to/file.txt'
    }
  }));
};
ws.onmessage = (event) => {
const response = JSON.parse(event.data);
console.log('收到MCP响应:', response);
};作为一个全栈架构师,我认为MCP代表了一个有价值的尝试,但其实现细节暴露了AI行业在软件工程实践上的不足[1]。与其被过度复杂的传输协议所困扰,不如关注MCP的核心价值:提供标准化方式让AI模型与应用程序交互。
在实际项目中,我们应该优化常见用例,而不是边缘情况。这意味着选择更简单、更成熟的技术栈,而不是盲目跟随最新的复杂设计。
期待未来MCP能够改进传输层设计,采用更符合工程最佳实践的方案。在此之前,我们需要保持批判性思考,选择最适合自己项目的技术路径。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-10-31
Opera One升级内置AI 迎来智能助手新纪元
2025-10-31
LangExtract——大模型文本提炼工具
2025-10-31
用户测评|DeepSeek-OCR,你用了吗?
2025-10-31
从Palantir智能化技术路线看AI时代企业级架构平台的核心战略位置
2025-10-31
OpenAI 公开 Atlas 架构:为 Agent 重新发明浏览器
2025-10-31
Palantir 本体论模式:重塑企业 AI 应用的 “语义根基” 与产业启示
2025-10-31
树莓派这种“玩具级”设备,真能跑大模型吗?
2025-10-30
Cursor 2.0的一些有趣的新特性
 
            2025-08-21
2025-08-21
2025-08-19
2025-09-16
2025-10-02
2025-09-08
2025-09-17
2025-08-19
2025-09-29
2025-08-20