2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

大模型问答流程节点设计:从一轮到多轮对话的意图识别

发布日期:2026-06-27 19:14:09 浏览次数: 1518
作者:数字矛盾体

微信搜一搜,关注“数字矛盾体”

推荐语

深入了解多轮对话中意图识别的关键作用,以及如何通过流程节点设计避免常见陷阱,提升AI客服的智能与效率。

核心内容:
1. 意图识别在多轮对话中的核心价值与常见误区
2. 多轮对话中意图漂移、跳变与追问失控三大陷阱
3. 优秀流程节点设计的核心原则与实践方法

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

大模型问答流程节点设计:从一轮到多轮对话的意图识别

你有没有注意过,大多数AI客服都像那种特别健忘的销售。

你说"我想买个手机",它回你一堆链接。你说"不是,我想看耳机",它继续推手机。第三轮你说"算了",它还在那儿推充电宝。

不是你表达能力有问题。是对话流程设计得太蠢。

单轮对话的时候,AI只需要回答一个问题。多轮对话,它得记住你说过什么、猜你想改什么、判断你是补充信息还是换了话题。

这三件事里,最关键的一个叫意图识别。


意图识别:多轮对话里最容易被忽视的"第一道门"

先搞清楚一件事——意图识别不是"听懂用户在说什么"。

是"听懂用户此刻真正想干什么"。

这两个差远了。

用户说"这个活动什么时候结束?"表面看是问时间。深层意图可能是"值不值得等"。用户说"能便宜点吗?"表面看是讲价。深层意图可能是"给我个理由现在下单"。

AI如果只回答表面问题,对话就结束了。回答不了深层意图,用户就流失了。

美洽科技做的一个实测发现:某个头部AI客服系统上线后,意图识别准确率提升到93%,客户满意度同步提升了25%以上(来源:美洽博客2026年横评报告)。

25%。

这个数字说明什么?意图识别不是锦上添花,是生死线。

但偏偏大多数企业在这件事上花的时间最少。


多轮对话的三个致命陷阱

很多人觉得,大模型这么强了,多轮对话不就是多记几轮历史吗?

不是。多轮比单轮难的地方,不在"记忆力",在"理解力"。

陷阱一:意图漂移

用户第一轮说"我想买手机"。第二轮"苹果的好像不错"。第三轮"不过预算有点紧"。第四轮"算了还是看安卓吧"。

从手机→苹果→预算→安卓。每一轮意图都在微调。

如果你的系统只在第一轮识别一次意图,后面全部按"买手机"处理——那从第三轮开始,你就完全理解错他了。

陷阱二:意图跳变

用户第一轮"帮我查查订单"。第二轮"对了,你们那个会员怎么退订?"。

两句话,两个完全不同的意图。中间没有过渡,没有铺垫。

这就是意图跳变。系统必须识别到"话题换了",清空上一轮的槽位和上下文,重新开始。

但很多系统做不到。它会把"退订会员"和"查订单"混在一起,最后给用户一个谁也看不懂的回复。

陷阱三:追问失控

用户说"我想订个酒店"。AI问"什么城市?"用户说"杭州"。AI问"几号?"用户说"下周六"。AI问"几个人?"用户说"两个"。

到这里,AI应该知道用户要什么了。但有些系统还在问——"要不要早餐?""对房型有要求吗?""预算多少?"

追问没有判定机制,用户就被问烦了。


好的流程节点是怎么设计的

我研究了几家做得不错的AI客服系统,发现它们在流程节点设计上有几个共同点。

第一:意图识别不是一次性的,是每轮都做

每一轮用户输入进来,先过一个意图识别模块。但这个模块不只是"分类"——它还得判断:

当前意图和上一轮是同一个吗?

如果相同,继续追问缺失的槽位信息。如果不同,判定为意图跳变,清空旧上下文,按新意图重新开始。

有些系统做得更细——给意图识别加一个置信度阈值。

置信度大于0.9,直接执行。0.8到0.9之间,需要澄清:"您是想XX对吗?"低于0.8,追问:"请问您具体需要什么帮助?"

这个阈值不是随便设的。是实际业务里跑出来的。

第二:槽位管理要有"增删改"逻辑

多轮对话的本质是一个信息收集过程。用户第一轮给了城市,第二轮补了日期,第三轮改主意了——"不对,下周五,不是下周六"。

这时候系统要把"下周六"覆盖成"下周五",而不是保留两个日期然后搞混。

槽位值的管理规则很简单:同一意图下,最新轮的值覆盖旧值。不同意图跳变后,旧槽位全部清空。

但就是这种"简单"的规则,很多系统没做好。

第三:追问要有"停止条件"

追问不是一直问。是问到你需要的信息齐了就停。

系统在每一轮都要检查:当前意图对应的预设槽位,哪些填了,哪些没填。全部填满→停止追问,进入下一步。没填满→选一个最关键的槽位追问。

这个"最关键的槽位"选择也有讲究。不能问用户已经说过的信息,不能问上一轮已经追问过的槽位。

追问的本质不是"获取更多信息",是"用最少的问题获取必要的信息"。


大模型在这件事上的优势和挑战

大模型做意图识别,和传统ICM(意图分类模型)比,有一个根本性的不同。

传统ICM需要先定义好所有意图类别,然后训练分类器。用户说的话如果不在预定义范围内,就识别不了。

大模型不需要预定义。它能理解用户用各种方式表达的同一个意图——"我想订房""帮我找个住的地方""今晚杭州有酒店吗"——这些在ICM里可能是三个不同的意图,大模型能识别成同一个。

但大模型也有自己的问题。

一个是过度泛化。用户说"随便看看",大模型可能识别出一个很具体的意图,然后开始疯狂推荐。用户只是闲逛,你却把他当潜在客户对待。

另一个是上下文污染。多轮对话里,AI生成的长回复会混入历史消息。下一轮意图识别的时候,这些AI生成的内容会干扰判断。有团队做了一个简单但有效的方案——对AI生成的历史回复做mask处理,只保留用户说的话做意图识别输入。

还有一个更隐蔽的问题——延迟

意图识别是每轮对话的第一个节点。它慢了,后面所有节点都慢。在客服场景里,用户等待超过3秒就想关窗口了。

所以有些团队做了"大小模型搭配"——用一个小模型做快速意图预判,只有置信度低的时候才调用大模型做精细识别。延迟从135ms降到61ms,准确率从76%提到93%。

这个数据来自掘金上的一篇技术实战文章——用Qwen3-0.6B做全参微调,4000条训练数据、8类意图,在4k上下文窗口、3轮对话的场景下跑的(来源:掘金技术社区)。


我的一点实操心得

我自己搭过几套多轮对话系统。踩过坑,也总结出几个有用的原则。

第一,意图识别的Prompt不能偷懒。

不能只写"你是一个意图识别助手"。要写清楚候选意图有哪些、每个意图的含义是什么、用户可能怎么说、容易混淆的情况是什么。

最好加上few-shot示例。给模型看3-5个正确的识别案例,比写十段描述管用。

第二,规则和大模型要搭配用。

纯靠大模型识别意图,容易飘。纯靠规则,又太死板。

最好的方案是大模型做主体识别,规则做兜底校验。比如用户明确说了"我要退订",不管大模型识别成什么,规则层直接拦截,走退订流程。

第三,别忽视"意图矫正"机制。

用户说了半天,系统识别错了。这时候最好的做法不是硬撑,是主动确认——"根据您提供的信息,我猜您是想XX,对吗?"

用户说对,就修正意图。用户说不对,就追问澄清。

承认自己可能判断错,比假装什么都懂强得多。


爽点总结

• 意图识别准确率达到93%,客户满意度同步提升25% — 美洽2026年AI客服实测

• 多轮对话三大陷阱:意图漂移(用户微调需求)、意图跳变(用户换话题)、追问失控(问到用户烦)

• 好的流程节点三要素:每轮都做意图识别 / 槽位增删改逻辑 / 追问有停止条件

• 大小模型搭配:小模型预判+大模型精细识别,延迟135ms→61ms,准确率76%→93%

• 上下文污染解法:对AI生成的历史回复做mask,只保留用户输入做识别

• 核心原则:意图识别不是一次性的,是每轮都在做


写在最后

去年做一个客服项目,团队花了两个月优化回答质量,用户满意度还是上不去。

后来我发现,问题不在回答本身——在用户还没到"需要回答"那一步,就已经走错了。

就像你去医院看错科室,医生水平再高也帮不了你。

重新设计了意图识别的流程节点,一周后满意度从62%涨到81%。

那周团队开了一个复盘会。我说了一句话:

"我们之前一直在优化答案,但用户的问题我们都没听对。"

有时候最难的不是回答正确。是先听懂问题。

"知之为知之,不知为不知,是知也。"——《论语·为政》

听懂问题,比急着回答更重要。好的对话系统,先把"听"这件事做好。


参考来源:

• 美洽 (Meiqia) 博客 (2026), "2026年AI智能客服意图抓取实测:5大系统横评与深度解析" — 多模态意图融合、上下文长程追溯、复杂场景对话有效性90%以上实测数据。

• 掘金 (2025), "让机器'听懂人话':多轮对话里的意图识别实战"(https://juejin.cn/post/7541292110311604224)— Qwen3-0.6B全参微调评测数据(延迟61ms、准确率93.1%)、意图跳变判定、槽位管理逻辑、mask处理方案。

• 53AI (2024), "大模型驱动多轮对话在智能营销场景下的应用与实践" — 意图识别+规则融合方案、槽位抽取与追问判定机制、Prompt构建方法。

• 阿里云 PAI (2025), "基于LLM的意图识别解决方案完整开发流程" — Qwen1.5意图识别方案开发实践。

• Fireworks AI Blog (2026), "Best Practices for Multi-Turn RL" — 多轮对话Agent的训练与工具调用最佳实践。

• Reddit r/LLMDevs (2026), "How are you testing multi-turn conversation quality in your LLM apps?" — 意图快照(Intent Snapshots)等社区实践。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询