微信扫码
添加专属顾问
我要投稿
Anthropic最新长文深度解析:如何让AI在超长上下文中精准抓取关键信息? 核心内容: 1. 从提示词工程到上下文工程的范式升级 2. 有效上下文工程的三大设计原则(系统提示/工具集/示例设计) 3. Agentic检索与混合策略在RAG系统中的创新应用
因此,我们需要制定策略来管理整个上下文状态,所以问题也就从如何写一条好提示升级为如何在每一轮只让模型看到最小充分信息集——这就是上下文工程的新战场。
提示应清晰、简洁且直接,避免过度复杂的 if-else 逻辑或假设共享上下文。我们建议将提示组织成不同部分(如背景信息、指令等),并用简单的标记语言(如 XML 或 Markdown)加以区分。随着模型功能增强,格式可能变得不那么重要。
系统提示
要用最少的信息概括预期行为,这并不等于简短,而是精确。通过初步测试模型的反应,识别问题并调整提示以提高性能。
工具的设计
至关重要,既能提升效率,又能避免功能过多导致决策模糊。为 AI智能体构建一个简洁、功能明确的工具集有助于长期稳定地管理上下文。
示例的设计
在提供示例时,应避免过度列举边缘情况,转而通过少量多样的标准示例有效引导模型行为。
总的来说,上下文应简明、具体且充实,以确保代理行为符合预期。
在《Building effective agents》中,他们定义了智能体为能在循环中自主使用工具的 LLM。随着模型功能的提升,Agent的自主性逐渐增强,能够独立探索问题并从错误中恢复。如今,许多 AI 应用采用基于RAG的方法为Agent提供重要的推理上下文。
“即时”情境策略不需要预先处理所有数据,而是通过维护轻量级标识符(如文件路径、查询、Web 链接)来动态加载数据。这种方法让Agent像人类一样按需检索信息,而不是记住全部数据。通过引用元数据(如文件夹层级、命名约定、时间戳等),Agent能够有效优化行为并逐步发现相关情境。
虽然运行时探索比预检索数据要慢,但合理的工具设计和启发式方法能提高效率。在某些任务中,混合策略(如预检索部分数据并进一步自主探索)可以更有效地平衡速度与自主性。Claude Code 就是采用这种方法,通过预加载文件并实时检索来避免过时索引和复杂语法问题。
所以这就是我一直推崇使用Cline式的主动探索式构建RAG的原因,虽然会牺牲实时性,但是只要前端有一定的反馈,用户体验式不会差的。
对于长期任务,Agent需要跨越上下文窗口的限制。压缩、结构化笔记和多智能体架构是应对这一挑战的技术。
压缩通过总结上下文历史,避免信息过载。
结构化笔记允许代理在上下文窗口外记录关键信息,保持任务一致性。
子代理架构则通过分配任务给专门的子代理,避免单个代理维护过多状态,提高任务处理效率。
这些技术可以根据任务需求灵活选择:压缩适用于对话任务,笔记记录适合迭代开发,而多代理架构则在复杂研究任务中表现优异。
上下文工程代表了我们构建 LLM 时的根本转变。随着模型能力的提升,挑战不再仅仅是设计完美的提示,而是如何精心挑选每一步输入模型的关键信息,以最大化结果的可能性。不论是处理长周期任务的压缩、设计高效的工具,还是让代理按需探索环境,核心原则始终不变
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-06
Karpathy:很多App就不该出生、人类唯一护城河只剩理解、CPU将沦为配角
2026-05-05
OpenAI 「实时语音」架构首次公开
2026-05-04
打造Claude Code的宝藏经验!提示缓存就是一切
2026-05-04
Apple Silicon 上本地跑 LLM,速度直接甩 Ollama 几条街
2026-05-03
奥特曼:Codex 正在经历 ChatGPT 时刻。这是要起飞了
2026-05-01
永别了,终端!OpenAI疯狂升级Codex,接管Mac人类全程0操作围观
2026-04-30
Karpathy 最新访谈:Vibe Coding 只是开始,真正重要的是 Agentic Engineering
2026-04-30
近4万Star!一个终端把自己变成了AI开发环境,Cursor和Claude Code都沉默了
2026-04-15
2026-03-31
2026-03-13
2026-02-14
2026-03-17
2026-02-09
2026-03-17
2026-04-07
2026-03-21
2026-02-20
2026-04-26
2026-04-22
2026-04-18
2026-04-13
2026-04-12
2026-04-07
2026-04-01
2026-03-31