我要投稿

Anthropic长文拆解上下文工程落地策略与实践

发布日期：2025-09-30 12:54:45 浏览次数： 1850

作者：AgenticAI

微信搜一搜，关注“AgenticAI”

把 200 k token塞满很容易，让模型在长上下文仍能够大海捞针却很难。Anthropic 在29号的官方长文里系统梳理了"上下文工程"（Context Engineering）这一新兴方向。本文将其进行技术拆解与压缩，务必让你快速掌握上下文工程。

1. 提示词工程的尽头是上下文工程

提示词工程主要关注的是怎么写，而上下文工程关注的则是给什么。Anthropic认为上下文工程是提示词工程的自然演化：当 Agent 运行多轮、系统指令、工具、MCP、外部数据、消息历史记录不断涌入时，根据大海捞针的测试，随着上下文窗口中Token数量的增加，模型准确回忆该上下文信息的能力会下降。

因此，我们需要制定策略来管理整个上下文状态，所以问题也就从如何写一条好提示升级为如何在每一轮只让模型看到最小充分信息集——这就是上下文工程的新战场。

faa261102e46c7f090a2402a49000ffae18c5dd6-2292x1290

2. 有效上下文工程剖析

提示应清晰、简洁且直接，避免过度复杂的 if-else 逻辑或假设共享上下文。我们建议将提示组织成不同部分（如背景信息、指令等），并用简单的标记语言（如 XML 或 Markdown）加以区分。随着模型功能增强，格式可能变得不那么重要。

系统提示

要用最少的信息概括预期行为，这并不等于简短，而是精确。通过初步测试模型的反应，识别问题并调整提示以提高性能。

工具的设计

至关重要，既能提升效率，又能避免功能过多导致决策模糊。为 AI智能体构建一个简洁、功能明确的工具集有助于长期稳定地管理上下文。

示例的设计

在提供示例时，应避免过度列举边缘情况，转而通过少量多样的标准示例有效引导模型行为。

总的来说，上下文应简明、具体且充实，以确保代理行为符合预期。

3. 上下文检索和Agentic检索

在《Building effective agents》中，他们定义了智能体为能在循环中自主使用工具的 LLM。随着模型功能的提升，Agent的自主性逐渐增强，能够独立探索问题并从错误中恢复。如今，许多 AI 应用采用基于RAG的方法为Agent提供重要的推理上下文。

“即时”情境策略不需要预先处理所有数据，而是通过维护轻量级标识符（如文件路径、查询、Web 链接）来动态加载数据。这种方法让Agent像人类一样按需检索信息，而不是记住全部数据。通过引用元数据（如文件夹层级、命名约定、时间戳等），Agent能够有效优化行为并逐步发现相关情境。

虽然运行时探索比预检索数据要慢，但合理的工具设计和启发式方法能提高效率。在某些任务中，混合策略（如预检索部分数据并进一步自主探索）可以更有效地平衡速度与自主性。Claude Code 就是采用这种方法，通过预加载文件并实时检索来避免过时索引和复杂语法问题。

所以这就是我一直推崇使用Cline式的主动探索式构建RAG的原因，虽然会牺牲实时性，但是只要前端有一定的反馈，用户体验式不会差的。

对于长期任务，Agent需要跨越上下文窗口的限制。压缩、结构化笔记和多智能体架构是应对这一挑战的技术。

压缩通过总结上下文历史，避免信息过载。

结构化笔记允许代理在上下文窗口外记录关键信息，保持任务一致性。

子代理架构则通过分配任务给专门的子代理，避免单个代理维护过多状态，提高任务处理效率。

这些技术可以根据任务需求灵活选择：压缩适用于对话任务，笔记记录适合迭代开发，而多代理架构则在复杂研究任务中表现优异。

总结

上下文工程代表了我们构建 LLM 时的根本转变。随着模型能力的提升，挑战不再仅仅是设计完美的提示，而是如何精心挑选每一步输入模型的关键信息，以最大化结果的可能性。不论是处理长周期任务的压缩、设计高效的工具，还是让代理按需探索环境，核心原则始终不变

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-02-04

Skills使用体验

2026-02-04

AgentScope 正式发布 Skills 支持 - 实现渐进式披露

2026-02-04

从“回答者”进化为“研究员”：全面解析 Deep Research

2026-02-04

刚刚，Xcode 史诗级更新：原生集成 Claude Agent SDK，苹果开发直接起飞！

2026-02-04

国产 Cowork 它来了！MCP、Skills和Expert Agents都支持，全部免费体验！

2026-02-04

混元研究博客上线姚顺雨团队最新成果：从 Context 探索语言模型的范式转变

2026-02-04

通俗讲解大模型短期记忆 vs 长期记忆

2026-02-04

谁动了我的电脑？谁应该抱怨？

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Pencil：设计和写代码，以后就全让AI干了

2026-01-24

独家实录｜唐杰、杨植麟、林俊旸、姚顺雨...All Star 对话上，大家聊了啥？

2026-01-10

我挖到Gemini 3.0 Pro十大隐藏玩法，做网页已经落后N个版本了

2025-11-19

深度体验TRAE SOLO 正式版，总结一点技巧(附完整可重现提示词和源码)

2025-11-13

从0到1玩转Clawdbot：我花了40小时，把这些坑都踩完了

2026-01-26

2026 开年 AI 工具推荐，让你新的一年效率起飞！（建议收藏）

2026-01-01

Codex 史诗级更新！引入 Skills 技能库，直接兼容 Claude 生态，开发效率原地起飞

2025-12-09

国内版的 NotebookLM 来了，甚至更强

2025-11-12

终于！Gemini CLI支持Agent Skills，一键搬运Claude Code的“绝招”

2026-01-09

Claude赢麻了？OpenAI Codex正式支持Skills，GitHub连夜上车！

2025-12-21

大家都在问

谁动了我的电脑？谁应该抱怨？

2026-02-04

刚刚！OpenAI 正式发布 Codex App，一人指挥一支 AI 军队，Cursor 慌了？

2026-02-03

谷歌Genie 3打崩游戏股！1小时500元的AI生成游戏，真能革游戏的命？

2026-02-03

史上最强编程模型Claude 5泄露，最慌的是黄仁勋？

2026-02-02

X上点赞近万的Claude Agent SDK教程，到底讲了什么？

2026-02-02

人人都在谈论ClawdBot，但你真的懂它的技术原理吗？

2026-02-02

刚刚，谷歌版「世界模型」震撼公测！网友实测炸翻天：游戏末日来了？

2026-01-31

Transformers V5正式发布！这次更新到底香不香？

2026-01-30

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean