2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

被 Y Combinator 看中的 AI 公司,如何打造生产级提示词,实现 46% 工单自动化

发布日期:2025-06-09 13:57:21 浏览次数: 2522
作者:Mindstorms

微信搜一搜,关注“Mindstorms”

推荐语

AI 技术如何推动工单自动化革命?揭秘 Y Combinator 投资的 Parahelp 公司如何用生产级提示词实现高效率。

核心内容:
1. Parahelp 公司如何帮助 Captions 平台实现 46% 工单自动化
2. 生产级提示词设计的核心挑战:处理不确定性
3. 如何通过结构化建模应对复杂商业决策

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

大多数人对 AI 提示词的理解,还停留在和 AI ChatBot 聊天的水平。但真正的商业 AI 系统,用的是完全不同的方法。

Y Combinator S24 投资的 Parahelp[1] 就是个典型例子。Ta 们帮 AI 视频创作平台 Captions 搭建客服系统,7 天就完成部署,实现了 46% 的客服工单自动化处理[2]。同时客户满意度提升了,响应时间缩短了,处理成本也降低了。Captions 的客户体验负责人 Eli Winderbaum 表示,客户基本分辨不出这是 AI 在回复。

这背后的秘密,就藏在 Parahelp 那几百行提示词[3]里。为了优化这些提示词,Ta 们投入了数百小时反复打磨。Y Combinator 的几位重要 Partners 在播客中专门讨论了 Parahelp 的提示词设计方法[4],将其作为 AI 工程实践的典型案例。Parahelp 服务过 Perplexity、Framer、Replit、ElevenLabs 等知名公司,这些实践经验让我们有机会窥一窥玩具提示词和生产级提示词的差异究竟在哪儿。

核心挑战:在不确定中保持可靠

设计生产级提示词面临的首要挑战是信息的不完整性。在 Parahelp 的客服场景中,完整的提示词包含约 1.5K 词元(token)的动态信息——消息历史、历史案例经验、公司政策等。模型可以访问一些相关信息,但很少是全部信息。

这种现实约束要求提示词必须明确处理不确定性。Parahelp 的提示词会反复强调这样的约束:

确保你的描述永远不假设任何信息、变量或工具调用(tool call)结果,即使你对工具调用结果有很好的想法
确保你的计划永远不包括或猜测政策文档中没有明确说明的信息

Parahelp 团队展示的提示词对 AI 的规划过程有极其详细的指导:

### 如何规划
- 规划下一步时,确保它只是下一步的目标,而不是工单或用户的总体目标。
- 确保计划始终遵循# 客户服务代理政策文档的程序和规则

### 如何创建步骤
- 步骤将始终包括行动的名称(工具调用)、行动描述和行动所需的参数。它还将包括特定行动的目标。

这些指令不是简单的建议,而是严格的操作规范。每一条都针对 AI 在真实环境中可能出现的具体错误模式。

复杂决策的结构化建模

真实的商业场景涉及复杂的条件分支。以退款处理为例,系统必须考虑购买日期、国家、计划类型等所有路径,因为退款规则根据这些参数而变化。

Parahelp 引入了"模型 RAM(工作记忆)"概念——模型能够可靠处理的路径数量。当决策分支超出模型处理能力时,团队通过架构设计来分解复杂性,而不是强行增加提示词复杂度。

一个重要发现是:o1-medium(现在使用 o3-medium)是第一个在这类提示词评估中表现良好的模型。这表明生产级提示词对模型能力有特殊要求,不是所有模型都能胜任这种复杂的条件推理任务。

这种规划提示词面临两个核心难点:

1. 完整的提示词包含约 1.5K 词元的动态信息...让模型理解它不应该假设自己掌握了完整信息(或预判工具调用会返回什么数据)是很困难的。

2. 计划必须包括基于工具调用返回内容和不同结果规则的所有潜在路径。对于退款请求,计划必须考虑基于购买日期、国家、计划类型等的所有路径。

这两个挑战精确地概括了生产级 AI 系统面临的核心困境:在信息不完整的情况下进行复杂的多路径决策。

为应对这种挑战,Ta 们采用变量引用系统:<> 表示工具调用结果,{{}} 表示特定政策。这样,模型可以在不需要工具输出的情况下跨多个工具调用进行规划。

这套系统对步骤创建有极其详细的要求:

image.png

更重要的是,提示词对 AI 的思维过程进行严格约束:

- action_name 应该始终是有效工具的名称
- description 应该是为什么需要该行动的简短描述、要采取的行动描述以及该行动需要的其他工具调用的任何变量
- 确保你在回答问题/故障排除步骤的描述中始终强调 

技术实现:XML 结构与条件逻辑

Parahelp 的方案大量使用 XML 结构化语法。o1/o3 是最重要的突破,其次是使用带条件的 XML if 块。这使模型更严格,但表现更好是因为它利用了模型从预训练中获得的编程逻辑能力。

一个关键设计决策是禁用 else 语句:故意不允许模型使用 'else' 块,而只使用 'if' 块。这要求模型为每个路径定义明确的条件,这种设计在评估中显著提高了性能。

以下是一个完整的计划示例(见附 1),展示了这种结构化方法的实际应用:

image.png

这个示例完美展示了企业级提示词的几个关键特征:多层嵌套的条件逻辑、明确的工具调用、变量引用系统(< helpcenter_result >和 {{troubleshooting_info_name_from_policy_2}}),以及每个分支的明确条件定义。

值得注意的是,这类示例的设计理念强调:

重要:这个计划示例只是为了让你了解如何构建你的计划...它不是严格的规则或你应该如何构建每个计划的方式——它使用变量名来让你了解如何构建你的计划,思考可能的路径并使用 

这种说明揭示了生产级提示词的一个重要特征:它们提供的是思维框架而不是死板的模板。AI 需要在这个框架内进行灵活的推理,而不是机械地执行固定步骤。

工程化的开发流程

与随意编写的提示词不同,生产级提示词需要严格的工程流程。Parahelp 团队的经验显示:花费数百小时优化仅仅几百行的提示词是常态。优化提示词的大部分时间实际上不是花在编写上,而是花在设计评估体系、运行测试、发现边界情况、在真实环境中验证以及基于结果进行迭代上。

这种严格的方法有明确的成功指标:客户支持有一个明确的成功指标——完整解决的工单百分比。每一次迭代都必须在这个核心指标上显示改进。

设计原则总结

从 Parahelp 的实践中可以提炼出专业级提示词的核心原则:

  1. 明确的思维顺序 - 指定模型的处理步骤
  2. 结构化格式 - 使用 markdown 和 XML 组织信息
  3. 角色定义 - 分配明确的角色(如"管理者")
  4. 关键指令强调 - 使用"重要"和"始终"等词突出关键要求

Parahelp 的第二个提示词(管理者提示词,见附 2)进一步强化了这些设计原则。它重申了同样的结构化要求,并特别强调了一些关键约束:

- 确保你在回答问题/故障排除步骤的描述中始终强调 

这种重复强调体现了企业级提示词的另一个特征:通过冗余来确保关键指令被遵循。在真实的商业环境中,AI 的一个微小偏差都可能导致客户体验的显著差异。

从聪明到可靠的转变

工业级提示词代表了从"让 AI 表现得聪明"到"让 AI 表现得可靠"的根本转变。它们通过精确的条件逻辑、变量引用系统、结构化语法和严格的迭代开发,将复杂的现实问题转化为 AI 能够一致处理的决策框架。

这种工程化的方法论不仅确保了在大规模商业应用中的可靠性,也揭示了一个更深层的洞察:真正有用的 AI 系统需要的不是更多的"智能",而是更好的"工程"。当我们从演示转向生产、从展示转向实用时,设计思维必须从追求惊艳效果转向确保稳定性能。

附 1:规划提示词

附 2:经理提示词


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅