Prompt 的那些事（一）

发布日期：2024-08-07 00:28:00 浏览次数： 3259

作者：北漂程序员日记

微信搜一搜，关注“北漂程序员日记”

关于Prompt，笔者准备写几篇文章来介绍Prompt 的特点，当前研究的进展，以及Prompt 自动生成和优化相关的工作。

今天这篇文章通过Google的一篇综述类论文来介绍Prompt的组成。

在做模型应用的过程中，Prompt 是连接模型和流程的桥梁，效果的好坏通常取决于Prompt 和模型本身。而对模型进行优化升级，也意味着高额的成本，那么通过优化Prompt 来充分挖掘模型的能力就显得非常有必要了。

在去年，大家都一直在说提示词工程师，但今年这种声音几乎听不到了。是不需要了吗？并不是，而是模型能力本身的提升对提示词的敏感度有了一定的下降，另外就是PE的工作加到算法工程师的内容中了。

那么面对那些魔法咒语一样的提示词，我们该如何入手，有没有一个总体的方向？

来看Google在6月22日的一篇论文：

TEACH BETTER OR SHOW SMARTER? ON INSTRUCTIONS AND EXEMPLARS IN AUTOMATIC PROMPT OPTIMIZATION

从图中可以很清晰的总结出以下几个点：

这对于我们平常编写Prompt具有很大的参考意义。另外论文还列举了一些指令优化的方法：

咒语：Let's think step by step
APE：Prompt进化算法，每次迭代都会评估Prompt在验证集上的效果，通过最好的指令来生成新的指令群。由此迭代直到收敛。论文：LARGE LANGUAGE MODELS ARE HUMAN-LEVEL PROMPT ENGINEERS
ProTeGi：收集目标LLM在验证集中回答错误的示例，并指示优化器LLM反思和评估这些错误，然后让优化器模型基于这些反馈更新指令。ProTeGi还使用与APE类似的改写过程（称为“蒙特卡罗采样”），并使用束搜索来确定最优指令。论文：Automatic Prompt Optimization with "Gradient Descent" and Beam Search
PromptAgent：类似于ProTeGi，但其规划代理使用更高级的蒙特卡罗树搜索（MCTS）算法进行策略规划和指令优化。论文：Promptagent: Strategic planning with language models enables expert-level prompt optimization
OPRO：通过隐式优化指令。从初始指令开始，每次迭代，OPRO将先前评估过的指令及其验证分数连接提供给优化器模型，而不是明确要求改写或反思。优化器模型作为黑盒优化器，根据提供的信息生成新的指令。论文：Large language models as optimizers

同样的，我们接着介绍一下在样例挑选上的一些方案：

Zero-shot: 无示例。优势：简单直接，不需要选择示例。
Random Selection：随机选择。优势：实现简单，可以在没有复杂优化策略的情况下快速选择示例。
Nearest Neighbor Selection：从验证集的正确预测示例中，选择与当前测试输入最相似的k个示例，通常使用余弦相似度来度量相似性。优势：选择与当前任务相关性高的示例，能够提高模型性能。
Diversity Selection：从验证集的正确预测示例中，使用k-means聚类等方法选择k个具有多样性的示例，以避免示例间的重复和相似。优势：提高模型在不同任务上的泛化能力。
All Exemplars Selection：对于具有长上下文窗口的模型（如Gemini 1.5），可以直接使用所有验证集的正确预测示例，无需选择。优势：充分利用长上下文窗口模型的能力，最大化使用示例的数量。
Random Search：从验证集的正确预测示例中随机采样m个示例组合，每个组合包含k个示例。评估每个组合在验证集上的性能，选择最佳组合用于测试。优势：简单易行，能有效探索示例空间。
Mutation Strategy：初始生成一组示例组合，然后通过对这些组合进行突变（如替换一个示例）来生成新的组合。每一代中，保留表现最好的组合，进行多轮迭代优化。优势：通过迭代优化，可以找到更优的示例组合。