我要投稿

大模型问答流程节点设计：从一轮到多轮对话的意图识别

发布日期：2026-06-27 19:14:09 浏览次数： 1518

作者：数字矛盾体

微信搜一搜，关注“数字矛盾体”

大模型问答流程节点设计：从一轮到多轮对话的意图识别

你有没有注意过，大多数AI客服都像那种特别健忘的销售。

你说"我想买个手机"，它回你一堆链接。你说"不是，我想看耳机"，它继续推手机。第三轮你说"算了"，它还在那儿推充电宝。

不是你表达能力有问题。是对话流程设计得太蠢。

单轮对话的时候，AI只需要回答一个问题。多轮对话，它得记住你说过什么、猜你想改什么、判断你是补充信息还是换了话题。

这三件事里，最关键的一个叫意图识别。

意图识别：多轮对话里最容易被忽视的"第一道门"

先搞清楚一件事——意图识别不是"听懂用户在说什么"。

是"听懂用户此刻真正想干什么"。

这两个差远了。

用户说"这个活动什么时候结束？"表面看是问时间。深层意图可能是"值不值得等"。用户说"能便宜点吗？"表面看是讲价。深层意图可能是"给我个理由现在下单"。

AI如果只回答表面问题，对话就结束了。回答不了深层意图，用户就流失了。

美洽科技做的一个实测发现：某个头部AI客服系统上线后，意图识别准确率提升到93%，客户满意度同步提升了25%以上（来源：美洽博客2026年横评报告）。

25%。

这个数字说明什么？意图识别不是锦上添花，是生死线。

但偏偏大多数企业在这件事上花的时间最少。

多轮对话的三个致命陷阱

很多人觉得，大模型这么强了，多轮对话不就是多记几轮历史吗？

不是。多轮比单轮难的地方，不在"记忆力"，在"理解力"。

陷阱一：意图漂移

用户第一轮说"我想买手机"。第二轮"苹果的好像不错"。第三轮"不过预算有点紧"。第四轮"算了还是看安卓吧"。

从手机→苹果→预算→安卓。每一轮意图都在微调。

如果你的系统只在第一轮识别一次意图，后面全部按"买手机"处理——那从第三轮开始，你就完全理解错他了。

陷阱二：意图跳变

用户第一轮"帮我查查订单"。第二轮"对了，你们那个会员怎么退订？"。

两句话，两个完全不同的意图。中间没有过渡，没有铺垫。

这就是意图跳变。系统必须识别到"话题换了"，清空上一轮的槽位和上下文，重新开始。

但很多系统做不到。它会把"退订会员"和"查订单"混在一起，最后给用户一个谁也看不懂的回复。

陷阱三：追问失控

用户说"我想订个酒店"。AI问"什么城市？"用户说"杭州"。AI问"几号？"用户说"下周六"。AI问"几个人？"用户说"两个"。

到这里，AI应该知道用户要什么了。但有些系统还在问——"要不要早餐？""对房型有要求吗？""预算多少？"

追问没有判定机制，用户就被问烦了。

好的流程节点是怎么设计的

我研究了几家做得不错的AI客服系统，发现它们在流程节点设计上有几个共同点。

第一：意图识别不是一次性的，是每轮都做

每一轮用户输入进来，先过一个意图识别模块。但这个模块不只是"分类"——它还得判断：

当前意图和上一轮是同一个吗？

如果相同，继续追问缺失的槽位信息。如果不同，判定为意图跳变，清空旧上下文，按新意图重新开始。

有些系统做得更细——给意图识别加一个置信度阈值。

置信度大于0.9，直接执行。0.8到0.9之间，需要澄清："您是想XX对吗？"低于0.8，追问："请问您具体需要什么帮助？"

这个阈值不是随便设的。是实际业务里跑出来的。

第二：槽位管理要有"增删改"逻辑

多轮对话的本质是一个信息收集过程。用户第一轮给了城市，第二轮补了日期，第三轮改主意了——"不对，下周五，不是下周六"。

这时候系统要把"下周六"覆盖成"下周五"，而不是保留两个日期然后搞混。

槽位值的管理规则很简单：同一意图下，最新轮的值覆盖旧值。不同意图跳变后，旧槽位全部清空。

但就是这种"简单"的规则，很多系统没做好。

第三：追问要有"停止条件"

追问不是一直问。是问到你需要的信息齐了就停。

系统在每一轮都要检查：当前意图对应的预设槽位，哪些填了，哪些没填。全部填满→停止追问，进入下一步。没填满→选一个最关键的槽位追问。

这个"最关键的槽位"选择也有讲究。不能问用户已经说过的信息，不能问上一轮已经追问过的槽位。

追问的本质不是"获取更多信息"，是"用最少的问题获取必要的信息"。

大模型在这件事上的优势和挑战

大模型做意图识别，和传统ICM（意图分类模型）比，有一个根本性的不同。

传统ICM需要先定义好所有意图类别，然后训练分类器。用户说的话如果不在预定义范围内，就识别不了。

大模型不需要预定义。它能理解用户用各种方式表达的同一个意图——"我想订房""帮我找个住的地方""今晚杭州有酒店吗"——这些在ICM里可能是三个不同的意图，大模型能识别成同一个。

但大模型也有自己的问题。

一个是过度泛化。用户说"随便看看"，大模型可能识别出一个很具体的意图，然后开始疯狂推荐。用户只是闲逛，你却把他当潜在客户对待。

另一个是上下文污染。多轮对话里，AI生成的长回复会混入历史消息。下一轮意图识别的时候，这些AI生成的内容会干扰判断。有团队做了一个简单但有效的方案——对AI生成的历史回复做mask处理，只保留用户说的话做意图识别输入。

还有一个更隐蔽的问题——延迟。

意图识别是每轮对话的第一个节点。它慢了，后面所有节点都慢。在客服场景里，用户等待超过3秒就想关窗口了。

所以有些团队做了"大小模型搭配"——用一个小模型做快速意图预判，只有置信度低的时候才调用大模型做精细识别。延迟从135ms降到61ms，准确率从76%提到93%。

这个数据来自掘金上的一篇技术实战文章——用Qwen3-0.6B做全参微调，4000条训练数据、8类意图，在4k上下文窗口、3轮对话的场景下跑的（来源：掘金技术社区）。

我的一点实操心得

我自己搭过几套多轮对话系统。踩过坑，也总结出几个有用的原则。

第一，意图识别的Prompt不能偷懒。

不能只写"你是一个意图识别助手"。要写清楚候选意图有哪些、每个意图的含义是什么、用户可能怎么说、容易混淆的情况是什么。

最好加上few-shot示例。给模型看3-5个正确的识别案例，比写十段描述管用。

第二，规则和大模型要搭配用。

纯靠大模型识别意图，容易飘。纯靠规则，又太死板。

最好的方案是大模型做主体识别，规则做兜底校验。比如用户明确说了"我要退订"，不管大模型识别成什么，规则层直接拦截，走退订流程。

第三，别忽视"意图矫正"机制。

用户说了半天，系统识别错了。这时候最好的做法不是硬撑，是主动确认——"根据您提供的信息，我猜您是想XX，对吗？"

用户说对，就修正意图。用户说不对，就追问澄清。

承认自己可能判断错，比假装什么都懂强得多。

爽点总结

• 意图识别准确率达到93%，客户满意度同步提升25% — 美洽2026年AI客服实测

• 多轮对话三大陷阱：意图漂移（用户微调需求）、意图跳变（用户换话题）、追问失控（问到用户烦）

• 好的流程节点三要素：每轮都做意图识别 / 槽位增删改逻辑 / 追问有停止条件

• 大小模型搭配：小模型预判+大模型精细识别，延迟135ms→61ms，准确率76%→93%

• 上下文污染解法：对AI生成的历史回复做mask，只保留用户输入做识别

• 核心原则：意图识别不是一次性的，是每轮都在做

写在最后

去年做一个客服项目，团队花了两个月优化回答质量，用户满意度还是上不去。

后来我发现，问题不在回答本身——在用户还没到"需要回答"那一步，就已经走错了。

就像你去医院看错科室，医生水平再高也帮不了你。

重新设计了意图识别的流程节点，一周后满意度从62%涨到81%。

那周团队开了一个复盘会。我说了一句话：

"我们之前一直在优化答案，但用户的问题我们都没听对。"

有时候最难的不是回答正确。是先听懂问题。

"知之为知之，不知为不知，是知也。"——《论语·为政》

听懂问题，比急着回答更重要。好的对话系统，先把"听"这件事做好。

参考来源：

• 美洽 (Meiqia) 博客 (2026), "2026年AI智能客服意图抓取实测：5大系统横评与深度解析" — 多模态意图融合、上下文长程追溯、复杂场景对话有效性90%以上实测数据。

• 掘金 (2025), "让机器'听懂人话'：多轮对话里的意图识别实战"（https://juejin.cn/post/7541292110311604224）— Qwen3-0.6B全参微调评测数据（延迟61ms、准确率93.1%）、意图跳变判定、槽位管理逻辑、mask处理方案。

• 53AI (2024), "大模型驱动多轮对话在智能营销场景下的应用与实践" — 意图识别+规则融合方案、槽位抽取与追问判定机制、Prompt构建方法。

• 阿里云 PAI (2025), "基于LLM的意图识别解决方案完整开发流程" — Qwen1.5意图识别方案开发实践。

• Fireworks AI Blog (2026), "Best Practices for Multi-Turn RL" — 多轮对话Agent的训练与工具调用最佳实践。

• Reddit r/LLMDevs (2026), "How are you testing multi-turn conversation quality in your LLM apps?" — 意图快照（Intent Snapshots）等社区实践。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业