微信扫码
添加专属顾问
我要投稿
Anthropic最新长文深度解析:如何让AI在超长上下文中精准抓取关键信息? 核心内容: 1. 从提示词工程到上下文工程的范式升级 2. 有效上下文工程的三大设计原则(系统提示/工具集/示例设计) 3. Agentic检索与混合策略在RAG系统中的创新应用
因此,我们需要制定策略来管理整个上下文状态,所以问题也就从如何写一条好提示升级为如何在每一轮只让模型看到最小充分信息集——这就是上下文工程的新战场。
提示应清晰、简洁且直接,避免过度复杂的 if-else 逻辑或假设共享上下文。我们建议将提示组织成不同部分(如背景信息、指令等),并用简单的标记语言(如 XML 或 Markdown)加以区分。随着模型功能增强,格式可能变得不那么重要。
系统提示
要用最少的信息概括预期行为,这并不等于简短,而是精确。通过初步测试模型的反应,识别问题并调整提示以提高性能。
工具的设计
至关重要,既能提升效率,又能避免功能过多导致决策模糊。为 AI智能体构建一个简洁、功能明确的工具集有助于长期稳定地管理上下文。
示例的设计
在提供示例时,应避免过度列举边缘情况,转而通过少量多样的标准示例有效引导模型行为。
总的来说,上下文应简明、具体且充实,以确保代理行为符合预期。
在《Building effective agents》中,他们定义了智能体为能在循环中自主使用工具的 LLM。随着模型功能的提升,Agent的自主性逐渐增强,能够独立探索问题并从错误中恢复。如今,许多 AI 应用采用基于RAG的方法为Agent提供重要的推理上下文。
“即时”情境策略不需要预先处理所有数据,而是通过维护轻量级标识符(如文件路径、查询、Web 链接)来动态加载数据。这种方法让Agent像人类一样按需检索信息,而不是记住全部数据。通过引用元数据(如文件夹层级、命名约定、时间戳等),Agent能够有效优化行为并逐步发现相关情境。
虽然运行时探索比预检索数据要慢,但合理的工具设计和启发式方法能提高效率。在某些任务中,混合策略(如预检索部分数据并进一步自主探索)可以更有效地平衡速度与自主性。Claude Code 就是采用这种方法,通过预加载文件并实时检索来避免过时索引和复杂语法问题。
所以这就是我一直推崇使用Cline式的主动探索式构建RAG的原因,虽然会牺牲实时性,但是只要前端有一定的反馈,用户体验式不会差的。
对于长期任务,Agent需要跨越上下文窗口的限制。压缩、结构化笔记和多智能体架构是应对这一挑战的技术。
压缩通过总结上下文历史,避免信息过载。
结构化笔记允许代理在上下文窗口外记录关键信息,保持任务一致性。
子代理架构则通过分配任务给专门的子代理,避免单个代理维护过多状态,提高任务处理效率。
这些技术可以根据任务需求灵活选择:压缩适用于对话任务,笔记记录适合迭代开发,而多代理架构则在复杂研究任务中表现优异。
上下文工程代表了我们构建 LLM 时的根本转变。随着模型能力的提升,挑战不再仅仅是设计完美的提示,而是如何精心挑选每一步输入模型的关键信息,以最大化结果的可能性。不论是处理长周期任务的压缩、设计高效的工具,还是让代理按需探索环境,核心原则始终不变
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-03-21
编程选GPT-5.4,还是GPT-5.3-Codex?
2026-03-21
AI Coding前端实践后的复盘总结
2026-03-21
OpenAI 首席科学家:Codex 只是雏形,我们要造的是「全自动 AI 研究员」
2026-03-21
谷歌Stitch「氛围设计」干崩Figma 8.8%股价:十年经验,败给巨头一次更新(附实测)
2026-03-21
为什么 CLI 比 MCP 更适合 LLM
2026-03-21
渐进式披露(Progressive Disclosure):Agent 从 Demo 到企业级落地的 “救命架构”
2026-03-21
AI 编程工具怎么选?Codex 和 Claude Code 的本质区别
2026-03-21
Karpathy 最新播客:我得了 AI 精神病、App 将消失、Agent 将碾压实验室
2026-01-24
2026-01-10
2026-01-01
2026-01-26
2026-01-09
2026-01-09
2026-01-23
2025-12-30
2026-01-14
2026-01-21
2026-03-21
2026-03-20
2026-03-19
2026-03-19
2026-03-19
2026-03-18
2026-03-17
2026-03-17