何时何地，你需要提示工程、函数调用、RAG还是微调大模型？

发布日期：2024-09-09 22:03:31 浏览次数： 2528

作者：新技术观察

微信搜一搜，关注“新技术观察”

介绍

在快速发展的生成式人工智能领域，某些流行术语已变得司空见惯：“提示工程”、“函数调用”、“RAG”和“微调”，你应该也经常遇到这些术语，但你是否能够理清这些概念之间的关系？这些其实都是一些大模型的应用策略和技术，本文将描述每个 LLM 策略的作用以及它们之间的关系，并简单介绍如何在它们之间选择最佳的用例。

回顾 LLM 的运作方式

在进一步讨论之前，让我们简单回顾一下 LLM 如何产生输出结果。

通俗地说，这就像完成完形填空一样：

给定一个单词序列，LLM 会查阅词典中的所有单词，并评估每个单词作为下一个单词出现的可能性
最有可能的单词将被选中并用于填空
重复上述步骤，直到没有更多空间可以填写

LLM 如何产生结果

更深入地，为了进行这些“完形填空”，LLM经历了一个训练过程，即阅读所有人类知识并记录将每个 token 视为下一个 token 的可能性。（注意：1 个 token 代表一个或多个单词）

LLM 生成“完形填空”测试结果的过程就是“推理”过程。

训练和推理是使LLM能够按预期发挥作用的两个核心过程。

这也解释了为什么有时 LLM 会自信地说错话——它所训练的人类知识可能没有包含我们希望它谈论的主题的足够信息。

因此，为了使 LLM 能够正常运作，我们需要向 LLM 提供更多有关主题的背景有用信息。

所有策略，包括函数调用、RAG 和微调都是围绕这一点展开的。它们是为 LLM 提供更多上下文有用信息的不同方法。

这些策略有哪些？它们之间有何关系？

纯粹的提示

第一个策略是纯粹的提示。从名称上就可以看出这个策略是如何运作的：

你向 LLM 发出查询
LLM 给出了答案

这其实就是“聊天”。你和 LLM 聊天就像和另一个人聊天一样。

当我们与 LLM 驱动的聊天机器人（例如 ChatGPT、Gemini 和 Copilot）聊天时，我们每天都会使用此策略。

2.代理+函数调用

第二种策略是 Agent 加函数调用。

此策略的工作原理如下：

你向 LLM发出查询
LLM 不会直接回答你，而是会参考给定的工具包，从中选择一个工具来先执行一些任务
为什么 LLM 会这样做？可能是因为它需要一些额外的信息，或者在回答你的问题之前需要满足一些先决条件。

这里的工具包是预先编写的函数或 API 调用的列表

LLM 将决定它想要使用的工具，并返回该工具的名称（即函数名称）

收到工具名称（函数名称）后，使用该工具（即调用函数）执行LLM所需的任务，并获取一些有用的信息。
您将有用的信息传回给 LLM，LLM 会使用它来生成对您原始查询的响应

如果这听起来仍然很抽象，让我们举一个例子：

你以旅行社的身份向 LLM 发出查询，例如“为我规划一次即将到来的圣诞节假期巴厘岛之旅”
LLM 认为，为了给你安排一个好的旅行，它首先需要你的预算信息。它参考了包含 get_budget()、get_destination_info()、get_weather() 等多个工具的给定工具包，并决定使用名为 get_budget() 的工具。
收到建议的工具名称后，您（作为应用程序）调用该函数get_budget()。假设它返回给您1000 元的预算。
你把1000元的预算信息传递给LLM，LLM会根据你的预算为你生成一份旅行计划清单

注意：函数调用绝对不仅限于单个函数。在此示例中，LLM 可能决定它还需要天气信息和目的地信息，因此它可能会选择其他工具。将调用哪些函数get_destination_info()以及get_weather()调用多少个函数取决于不同的因素，其中包括：