2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

为什么说上下文工程是AI产品成功的关键?

发布日期:2025-08-26 09:15:59 浏览次数: 2459
作者:重生之我在AI时代

微信搜一搜,关注“重生之我在AI时代”

推荐语

AI产品成败的关键:上下文工程如何让大模型真正听懂人话?

核心内容:
1. 揭秘AI产品"答非所问"的根源:缺失的上下文翻译层
2. 上下文工程五大核心组件:从信息筛选到动态管理
3. 实战方法论:如何构建持续演化的AI认知框架

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

如果你是一名产品经理,在构建AI产品的过程中,一定面临过这样的灵魂拷问:

- 为什么演示时流畅的智能客服,上线后用户却投诉“答非所问”?

- 为什么耗资百万训练的行业大模型,关键决策错误率比规则引擎的还高?

- 为什么增加上下文长度后,效果反而断崖式下跌?


而这些问题,很可能不是因为模型不够聪明,而是产品缺失了「翻译官」——在用户意图与AI能力之间,正横亘着一片可能被绝大多数产品经理忽视的黑箱地带,那就是上下文工程


也就是说,真正决定产品存亡的战场其实在——如何把用户、场景、数据翻译成AI听得懂的「产品语言」。


本文将从以下几点聊一下我对上下文工程的理解:
1、什么是上下文工程?
2、它能解决什么问题?
3、怎么找到最佳的上下文?
4、如何效果评估?

  01 

什么是上下文工程?

简单来说,上下文工程是系统地设计、管理和优化输入到大语言模型的信息和环境(即“上下文”),以引导模型生成更准确、相关、有用且一致的输出。


我认为,核心的组成部分包括以下这些:

1、信息组装与选择

  • 确定哪些信息对模型理解任务和目标至关重要。

  • 从海量可用数据(用户输入、系统状态、数据库查询结果、知识库文档、聊天历史等)中筛选出高价值、低噪音的关键信息片段。

  • 这是克服模型输入长度限制的关键,需要“把好钢用在刀刃上”。


2、结构化与格式化

  • 将选定的信息以模型易于理解和有效利用的方式组织和呈现。

  • 这可能包括:

    • 添加结构标记: 使用标签、标题、分隔符(如###)、列名等。

    • 指令嵌入:在上下文中嵌入清晰的任务指令、目标、约束条件(角色扮演、输出格式要求)。

    • 示例嵌入:在上下文中包含少量高质量的示例。

    • 知识注入:将关键事实、实体关系、定义等精确信息嵌入上下文。

    • 思维链提示: 在上下文里引导模型的思考路径(“让我们一步步思考…”)。


3、动态上下文管理

  • 上下文通常不是静态的,而是在会话应用或多轮交互中,上下文需要根据对话状态、用户意图和之前的交互历史动态更新和维护。

  • 需要策略来决定保留哪些历史信息(摘要?关键点?完整对话?)、何时截断、如何合并新信息等等。


4、指令设计融合

指令设计(Prompt Engineering的传统领域)仍然是上下文工程的一部分,但它不再是孤立的,而是需要和精心设计的上下文紧密结合、协同工作,共同指导模型。


5、与大模型特性对齐

理解目标LLM的架构、训练数据偏好、token限制、处理上下文的方式(是平均关注所有token?还是更关注开头结尾?)等,以便优化上下文结构。


  02 

它能解决什么问题?

上下文工程的核心价值在于突破传统提示工程的固有局限,从根本上提升AI系统的实用性与可靠性。


静态的Prompt模板在面对动态变化的业务场景时往往捉襟见肘,而上下文工程通过智能注入实时的业务数据、用户状态及环境参数,为模型构建起持续演化的认知框架。


这种动态知识供给不仅显著抑制了模型的幻觉风险,更通过结构化指令(角色定义、输出规范)和嵌入式规则(促销逻辑、风控条款)的协同作用,使模型行为具有高度可预测性。


当智能客服需要同时处理用户情绪、订单历史、促销规则等多维信息时,上下文工程成为整合复杂信号的关键枢纽。


本质上是通过构建“持续进化的业务记忆体”,将碎片化信息转化为可执行的决策图谱。这种能力使得AI产品从简单的问答机器人蜕变为真正理解业务语境的智能体,从而在用户体验与商业价值的交汇点能够释放出巨大的潜力。


  03 

如何为你的AI产品找到最佳的上下文?

先说结论:我认为没有一刀切的“最佳”方案,而是需要系统性的分析和实验才能找到

以下是我总结的一些关键步骤:


第一步:明确定义任务和目标
你的AI应用具体要解决什么问题?希望模型输出什么?
用户是谁?在什么场景下使用?核心价值是什么?

第二步:识别所有潜在的信息来源
用户输入:当前的问题、指令。
系统状态/环境:当前时间、地理位置、用户身份、操作权限、应用当前状态等。
知识库/文档:内部文档、产品手册、FAQ、法规、代码库片段、数据库查询结果等。
历史对话/交互:之前的用户问题、系统回答(完整的、还是提取的关键点或摘要?)。
预定义的规则/指令/约束:需要模型遵守的特定规则、输出格式要求等。
示例(Few-Shot Learning):高质量的输入-输出样本。

第三步:分析信息的相关性与价值

对于当前任务和用户意图,哪几条信息最相关、最关键?

每条信息的“信息密度”如何?(是冗长的废话,还是浓缩的精华?)

信息之间是否存在冲突或冗余?如何解决?


第四步:考虑模型的token限制

绝对限制:明确目标LLM的最大上下文长度。

成本效益:上下文越长,API调用成本就越高,并且长上下文可能会导致模型性能下降或注意力关注点分散,所以我们需要在成本和效果之间找到平衡。


第五步:设计和格式化上下文

结构化:使用清晰的分隔符、标签、标题将不同类型的信息区分开来。

整合指令:将任务指令、角色设定巧妙地与提供的上下文数据结合起来。

嵌入示例:如果需要,选择最相关的少数示例嵌入上下文。

嵌入关键知识:对于模型可能不知道或容易出错的关键事实点,直接嵌入上下文。

格式化输出要求:明确期望的输出结构(如JSON、列表、步骤、代码块等)。

考虑顺序:LLM对上下文开头和结尾的信息可能更敏感,所以关键的指令或信息可以考虑放在开头或结尾中。


第六步:应用特定策略

长文档处理:使用向量数据库进行语义搜索选择最相关的片段、生成多个不同粒度的摘要(全文摘要、章节摘要)、提取关键实体/事实等手段。

会话应用:维护对话状态、有效摘要历史对话的关键信息、动态选择需要保留或遗忘的内容、检测用户意图变化。

复杂推理任务:显式地在上下文中引导推理步骤(比如使用思维链、思维树等),注入必要的推理规则或中间变量。


  04 

如何进行效果评估?

总结来说,可以通过使用实验、测试和AB测试的方式对不同的上下文进行评估,具体说明如下:

1、对比不同上下文策略

创建几个不同版本的上下文,比如:

V1使用 仅用户问题 + 简短指令,

V2使用 用户问题 + 关键数据摘要 + 详细指令,

V3使用 用户问题 + 更多背景信息 + 示例 + 指令,


然后在同一组测试用例上测试它们。


2、建立评估指标

准确性:输出内容是否正确?

相关性:输出是否直接回应了用户需求和上下文信息?

完整性与清晰度:是否覆盖了关键点?表达是否清晰?

一致性:不同语境或不同表述下输出是否稳定?

效率:使用的token数量?API是否有延迟?


3、收集用户反馈

最终使用产品的用户的切身体验和感受是最具权威性和决定性的标准。

比如,对于智能客服,即便从技术指标看回答准确、相关,但用户却觉得对话体验生硬、难以理解,那也说明产品存在问题。所以在评估上下文工程效果时,要高度重视最终用户的真实感受。


4、分析失败案例

为什么这次交互失败了?是缺少关键信息?信息冲突?指令不清晰?上下文太长导致关键点被遗忘?


5、持续优化

根据测试结果和反馈,不断调整信息选择、结构化和格式化的策略。


写在最后

我认为,上下文工程是构建真实可用AI应用的核心杠杆。


它不是简单的堆砌信息,而是精准定位关键信息、巧妙结构化信息、动态管理信息,并将其与清晰的指令深度结合的艺术与科学。


找到“最佳”上下文没有捷径,因为它源于对任务、用户、信息源和模型能力的深刻理解,并通过持续的实验、测试和迭代优化而来。


所以,掌握它,你就能大幅提升LLM应用的性能和可靠性。

#AI产品经理 #上下文工程

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅