我要投稿

MCP 与 CLI 之争，本质是一场速度博弈

发布日期：2026-04-08 09:37:36 浏览次数： 1888

作者：OpenBuild

微信搜一搜，关注“OpenBuild”

OpenBuild 导读：

在 AI 智能体工具调用的赛道上，MCP 与 CLI 的路线之争从未停歇。一方凭借结构化、可审计的优势成为企业级首选，另一方则以轻量低延迟占据效率高地。而随着 Perplexity 公开宣布弃用 MCP、回归 CLI 与 API，这场技术路线的辩论被彻底推向高潮。双方分歧看似围绕协议展开，实则核心都指向同一个关键指标：速度。

原标题：The Debate of MCP vs. CLI Centers on Speed.

MCP 走过成型之年，却在一周内陷入巨大争议。

https://x.com/morganlinton/status/2031795683897077965

在 Ask 2026 大会上，Perplexity CTO Denis Yarats 登台宣布：Perplexity 将弃用 MCP，重新回归 API 与 CLI 方案。

消息一出，社区立刻分成两大阵营。

这并不令人意外。毕竟 MCP 最初只是 Anthropic 在 2024 年 11 月推出的一项开放标准，却在短短 13 个月内实现全行业普及，横跨多家公司与平台，月下载量突破 9700 万。而现在，一家头部 AI 公司却选择退出。

https://www.anthropic.com/news/donating-the-model-context-protocol-and-establishing-of-the-Agentic-ai-foundation

MCP 的额外开销并非毫无意义。该协议的设计思路，是把模型交互约束在明确、可审计的固定路径上：

每次工具调用都会携带完整的 Schema 定义
每次鉴权握手都走完整端到端流程
每一步执行都必须等待上一步完成

这种强规范性与可预测性，正是企业级落地所需要的。

但代价也显而易见：在多步工作流中，每一个结构化步骤都会引入延迟，延迟会在一连串工具调用中不断累积。

/ 01

反对 MCP 的声音

支持 Perplexit 这一决定的人认为：MCP 的Token 开销过高，严重拖慢运行时性能，而且接入工具越多，问题越严重。

DevCommunity 的 Samir Amzani 给出了一个直观对比：只接入 GitHub、Slack、Sentry 三个服务，MCP 在上下文窗口中就会塞入超过 55,000 个 Token 的工具定义，甚至早于模型读取用户消息。其 Token 占用是 CLI 的 3～42 倍。

/ 02

支持 MCP 的声音

尽管承认 MCP 存在延迟问题，但其支持者指出，切回 CLI 会让开发者失去一系列关键能力。CLI 确实轻量、快速，但也高度静态：

只能调用预先写死在代码里的工具
每个服务都需要开发者单独维护鉴权
没有统一的协议层来做可观测性与调试

Perplexity 并未发布官方解释，但这场分歧本质上反映了真实的工程需求差异：

对延迟敏感的团队会觉得 CLI 更实用
重视可观测性与生产环境安全性的团队，则愿意为 MCP 的结构化付出开销

/ 03

跳出 “协议选择” 本身

切换到 CLI 和 API 确实能解决一部分问题：Token 开销下降，单步延迟降低。但这并不能解决所有问题。一些更底层的约束 —— 比如大规模场景下的延迟叠加、不安全的代码执行 —— 并不能靠简单替换接口来彻底解决。

这些更深层的问题，指向两个更值得关注的方向：推理基础设施与代码执行环境。

方向一：更高性能的推理

一个核心思路是优化推理底层，直接解决延迟问题。Cerebras 晶圆级引擎等新一代低延迟 AI 芯片架构，可以将模型权重保持在片内存储，而不依赖传统 GPU 的片外内存，从而消除内存瓶颈。

效果显著：推理速度最高可达 3000 Token / 秒，相较传统 GPU 方案提升约 15 倍（视模型而定）。

这会直接改变 MCP 的性价比。当推理足够快时，搭配 MCP Server、GitHub 代码上下文、Slack 团队数据、Atlassian 项目状态等工具，每次调用的延迟成本会大幅降低。曾经让人难以接受的开销，会变得可以接受。

对于优先选择 MCP 可审计性的企业来说尤为重要：更快的推理不必牺牲安全层，只是让整套工具调用栈在生产环境真正可行。

https://artificialanalysis.ai/models/glm-4-7/providers

方向二：安全的代码执行

另一个方向是安全代码执行。运行智能体生成的代码，本质是在安全与速度之间做权衡。

Pydantic 推出的 Monty—— 一个用 Rust 编写的极简 Python 解释器 —— 选择了另一条路：最小化执行域。它不启动容器，也不暴露完整运行时，只执行智能体真正需要的逻辑：

无文件系统访问
无网络调用
无环境变量，除非显式授权
仅在外部调用需要授权时暂停

因为解释器极度精简，提示注入的攻击面也大幅缩小。

启动时间低至 0.06 毫秒，对比之下：Docker 为 195 毫秒，通用沙箱服务超过 1000 毫秒。

当然，Monty 仍处于实验阶段，仅支持部分 Python 子集，暂无第三方库支持，暂不适合生产。但它已经给出了清晰可行的演进方向。

https://modelcontextprotocol.io/docs/getting-started/intro

https://github.com/pydantic/monty

/ 04

这些优化对 MCP 和 CLI 同样有利

围绕 MCP vs CLI 的痛点都是真实存在的：Token 开销大、执行链路慢、运行智能体代码有风险…… 这些并无争议。但很大一部分性能提升空间，其实在于推理基础设施与执行环境，而不只是协议本身。而且这类优化并非 MCP 专属，CLI 同样可以受益。

/ 05

重新理解这场取舍

Perplexity 是基于现实约束做出的务实选择，很多转向 CLI 的团队也是如此：因为 MCP 太慢了。与此同时，也有大量团队坚定留在 MCP 生态中。

基于各自的业务需求，两种选择都合理。

在 MCP 与 CLI 的争论持续之际，抛开协议本身，推理基础设施与代码执行环境同样值得行业重点关注。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-05-24

我把 AI 账单从 30 美金打到 5 美金

2026-05-24

企业级智能体，必须长在自己的业务里

2026-05-24

Shopify 23,000 名工程师背后的 Claude Code 配置方案

2026-05-23

Harness Monitor：当多个 Agent 同时写代码时，如何看住质量

2026-05-23

从 Appshots 到 Goal Mode：Codex 正在变成工作流 Agent

2026-05-23

2小时烧掉9亿token后，我发现了OpenAI和Anthropic在/goal上的本质区别

2026-05-23

我在一天内完成10场用户访谈，领导大受震撼

2026-05-23

Codex 的 computer use 功能，为什么这么好用？

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

OpenAI Codex CLI 完整使用指南

2026-04-07

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

2026年国内如何注册 Claude 账号教程

2026-03-13

独家| DeepSeek-V4终于要来了：梁文锋憋半年大招，多模态+长期记忆全面破局

2026-03-17

Claude Code 和 Codex 接入 Figma MCP 保姆级教程

2026-04-07

香港终于能直接用 Gemini 了，内地用户能用上吗？

2026-03-17

编程选GPT-5.4，还是GPT-5.3-Codex？

2026-03-21

GPT5.5来了，最大特点解析

2026-04-24

刚刚，GPT-5.4 发布，百万上下文、最强全能模型

2026-03-06

大家都在问

Codex 的 computer use 功能，为什么这么好用？

2026-05-23

前有用友YonClaw，今有金蝶灵基，中国软件双雄的AI底牌谁能笑到最后？

2026-05-21

Harness Engineering：AI 能在真正"出事会炸"的后端系统里写代码吗？

2026-05-19

谁来给企业端即将大规模入职的Agent盖办公室？

2026-05-09

鹅厂员工觉得好的code模型应该具备什么能力？

2026-05-09

Markdown要被抛弃了？Claude Code工程师自曝：我已彻底放弃使用Markdown！团队倾向使用HTML！网友：其他编辑工具会被淘汰吗？

2026-05-09

AI吞噬软件的叙事要分化了？

2026-05-08

为什么同一个模型，在 Claude Code/Codex CLI 里感觉像换了个脑子？

2026-05-07

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw