我要投稿

200k Tokens 的上下文真的够用吗？

发布日期：2025-12-15 11:55:07 浏览次数： 1796

作者：字节笔记本

微信搜一搜，关注“字节笔记本”

放眼看去，现在各大闭源开源的Code模型还是以200K的居多。

200k Tokens真的够用吗？

Amp 团队最近写了一个文章，说200k Tokens才是正道，不仅是够用，而且相当长的时间它就应该是主流。

以Opus 4.5为例子，已发布几周了，它是Amp团队的主力模型，也被公认为目前最强的编程模型。下放！Opus 4.5 在Claude Code 20刀订阅中可用

但它的上下文窗口只有200ktokens。

有人诟病说不如Gemini 3 Pro的好，都2025年了，纯是挤牙膏。

但是Amp团队觉得200ktokens就刚刚好，这不仅仅是它们团队中某个人的偏好，而是整个团队都在践行的一种工作哲学，全员短线程。

为什么要抛弃百万级 Context？

Amp团队也是从它们无数爬坑的实践中得的理论，Amp团队最近给 Amp 上线了一个新功能，在命令面板中添加发送至支持的指令。

这个任务不是直接在一个巨大的窗口上下文中完成，而是由一组相互连接的微小工作线程组成的。

最大的一个工作线程用了151k输出 tokens，只有四条用户消息。

平均下来的工作线程长度在80k tokens左右。

即便把这13个相关联的工作线程全部加起来，其实也勉强能塞进一个100 万 token 的窗口里。

那么问题来了，为什么不直接把所有东西丢进一个超大工作线程里，省去开新对话的麻烦呢？

Amp 团队的观点是：因为Agent会喝醉

Amp团队在他们的 Context 管理指南里写过这样一句话，如果你喂给 Agent 太多 tokens，它们会醉。

原因很简单，上下文过载的模型行为像醉汉！

模型开始胡言乱语，逻辑混乱，甚至和开发者抬杠，如果继续喂数据，它们吐出来的代码更是一塌糊涂。

Agent的本质是模型、系统提示词、工具以及对话历史的集合。

对话越长，历史包袱越重，充斥着大量与当前任务无关的噪音。

想要Agent表现最佳，必须只提供完成当前任务所需的上下文，多一点都是累赘。

长对话是陷阱

除了效果差，长对话还是成本黑洞。

每一次请求，所有历史 token都要重新发送给模型提供商。成本呈指数级上升，尤其是象Cursor这种现在已经全面按Token收费的厂商。

而且时间越长回答就越慢！

长工作线程往往更长的思考停顿，而且累计起来的结果就是错过缓存窗口，Token爆炸。

那应该怎么做呢？

把线程拆碎，就是把任务拆碎

他们应该最正确的是方式是，任务拆解。

其实传统开发，就是这种模块化开发，把大任务拆成一个个小任务。

AI Code也应如此。

让每一个线程都有一个明确的目标，才能让原本复杂的开发流程变得清晰、可控，而且速度极快。

自下而上的构建流

观察Amp团队的编码方式，这是一种典型的自下而上的构建过程。

首先，开一个工作线程构建基础实现。

如果特别复杂，会先开一个工作线程专门调研代码库，收集上下文。

有了基础后，开启全新的线程来进行调整或重构。

一个改动就是一个线程。使用工具读取上一个工作线程的上下文。

代码写完了，评审环节也是新工作线程。

让 AI 阅读新代码，检查是否符合现有的设计模式，确保没有引入坏味道。

验证阶段，再开几个新线程，写一次性脚本、跑测试、分析性能日志、强制触发错误状态。

在Amp中，开发者通过引用 ID 或 URL 来在线程间传递上下文，这比使用多个 markdown 文件来记录规格和历史要轻量得多。

整个过程非常流畅。

新建线程，输入引用指令关联上一个相关线程。

如果需要主线程的背景，一键切换回去。

这就是高效团队的工作流。

每一个线程都是一个离散的原子任务，无数个原子任务聚合成了一个完整的功能。

方向盘依然在人手中，车速更快，路费更省，逻辑更清晰。

所以，200k tokens 够吗？

就目前来说，只要掌握了模块化子任务，简直是绰绰有余！

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-02-04

从“回答者”进化为“研究员”：全面解析 Deep Research

2026-02-04

刚刚，Xcode 史诗级更新：原生集成 Claude Agent SDK，苹果开发直接起飞！

2026-02-04

国产 Cowork 它来了！MCP、Skills和Expert Agents都支持，全部免费体验！

2026-02-04

混元研究博客上线姚顺雨团队最新成果：从 Context 探索语言模型的范式转变

2026-02-04

通俗讲解大模型短期记忆 vs 长期记忆

2026-02-04

谁动了我的电脑？谁应该抱怨？

2026-02-03

从 CLI 到桌面：Codex 把 coding agent 变成“任务指挥台”

2026-02-03

谷歌重大更新：国内手动开启 Gemini AI 侧边栏与 Auto Browse 自动浏览全攻略

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Pencil：设计和写代码，以后就全让AI干了

2026-01-24

独家实录｜唐杰、杨植麟、林俊旸、姚顺雨...All Star 对话上，大家聊了啥？

2026-01-10

我挖到Gemini 3.0 Pro十大隐藏玩法，做网页已经落后N个版本了

2025-11-19

深度体验TRAE SOLO 正式版，总结一点技巧(附完整可重现提示词和源码)

2025-11-13

从0到1玩转Clawdbot：我花了40小时，把这些坑都踩完了

2026-01-26

2026 开年 AI 工具推荐，让你新的一年效率起飞！（建议收藏）

2026-01-01

Codex 史诗级更新！引入 Skills 技能库，直接兼容 Claude 生态，开发效率原地起飞

2025-12-09

国内版的 NotebookLM 来了，甚至更强

2025-11-12

终于！Gemini CLI支持Agent Skills，一键搬运Claude Code的“绝招”

2026-01-09

Claude赢麻了？OpenAI Codex正式支持Skills，GitHub连夜上车！

2025-12-21

大家都在问

谁动了我的电脑？谁应该抱怨？

2026-02-04

刚刚！OpenAI 正式发布 Codex App，一人指挥一支 AI 军队，Cursor 慌了？

2026-02-03

谷歌Genie 3打崩游戏股！1小时500元的AI生成游戏，真能革游戏的命？

2026-02-03

史上最强编程模型Claude 5泄露，最慌的是黄仁勋？

2026-02-02

X上点赞近万的Claude Agent SDK教程，到底讲了什么？

2026-02-02

人人都在谈论ClawdBot，但你真的懂它的技术原理吗？

2026-02-02

刚刚，谷歌版「世界模型」震撼公测！网友实测炸翻天：游戏末日来了？

2026-01-31

Transformers V5正式发布！这次更新到底香不香？

2026-01-30

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean