我要投稿

Prompt是与LLM对话的唯一方式：如何给大模型装上能指挥“手脚”的脑子？

发布日期：2025-12-16 08:15:39 浏览次数： 1839

作者：彭俊旗的AI工具箱

微信搜一搜，关注“彭俊旗的AI工具箱”

大家好。

在前2篇文章里，我们像是一个严苛的老师，教会了 AI 怎么查资料（RAG），也教会了 AI 怎么慢下来思考（CoT）。

经过这一番调教，你的 AI 已经变得博学且严谨。

但很快，作为AI应用开发的你，会触碰到一个新的天花板：

无论这个 AI 多么聪明，它始终是一个轮椅上的天才。

•

你问它：“今天杭州天气怎么样？”它回答：“抱歉，我的数据截止到 2023 年。”

•

你让它：“帮我算一下这三个 Excel 表格的总和。”它可能会一本正经地胡编一个数字，因为它不擅长数学计算。

•

你让它：“帮我把这个文件发给老板。”它只能无奈地说：“我只是一个语言模型，我无法操作你的微信。”

它只能“说”，不能“做”。 它被困在了对话框里，与现实世界隔绝。

如何打破这个边界？如何让 AI 走出“思维的宫殿”，真正去接触现实世界？

今天，我们要揭秘大模型领域最激动人心、也是从 Chatbot 进化为 Agent（智能体）的核心机制：ReAct。

01 什么是 ReAct？像侦探一样思考

ReAct 这个词，是 Reasoning（推理） 和 Acting（行动） 的缩写。

如果说 CoT（思维链） 是让 AI 学会“三思而后行”，那么 ReAct 就是让 AI 学会一边思考，一边干活。

这听起来很抽象？我们用一个生活中的例子来打比方。

想象一下，你就是福尔摩斯。
当你接到一个案子（用户问题）时，你不会坐在椅子上干想（纯 LLM 生成），你也不会像无头苍蝇一样到处乱撞（纯脚本执行）。

你的工作流是这样的：

思考（Reasoning）： “死者手里攥着一张车票，我应该去查查这张车票的来源。”

行动（Acting）： 拿起电话，打给火车站（使用工具）。

观察（Observation）： 电话那头说，车票是今早 8 点发出的。

再思考（Reasoning）： “8 点？那时死者应该在家里。说明有人撒谎了。我得去查查监控。”

再行动（Acting）： 调取监控录像（使用工具）。
...

这就是 ReAct。

它打破了“输入 -> 输出”的一波流模式，把解决问题的过程变成了一个思考 -> 行动 -> 观察 -> 再思考的循环。

02 一张图看懂：从“单行道”到“死循环”

很多朋友觉得 ReAct 的原理好懂，但具体运行逻辑很模糊。

为了彻底讲透，我画了两张图。

以前的模式（Chatbot）：
这是一个线性的单行道。你问什么，它答什么。如果它不知道（比如实时股价），它就只能瞎编。

ReAct 的模式（Agent）：
这是一个动态的闭环。当模型发现自己无法直接回答时，它会发起请求，系统执行完把结果喂回给模型，让它继续想。

这个过程，就像是一个程序的 while 循环：

看明白了吗？
AI 不再是用“记忆”回答问题，而是学会了使用工具去寻找答案。

当用户问：“对比一下京东和亚马逊上 iPhone 15 的价格。”

AI 的内心戏（Log）会变成这样：

Thought 1： 用户想比价。我需要先查京东的价格。
Action 1： 调用工具 Search_JD("iPhone 15")
Observation 1： 结果：5999 元。
Thought 2： 知道了京东的，我现在需要查亚马逊的。
Action 2： 调用工具 Search_Amazon("iPhone 15")
Observation 2： 结果：6100 元。
Thought 3： 5999 < 6100。结论是京东更便宜。
Final Answer： 建议您在京东购买，便宜 101 元。