AIGC 赋能展示广告：大模型在小红书标题生成中的深度实践

发布日期：2024-09-02 20:06:13 浏览次数： 5689

作者：小红书技术REDtech

微信搜一搜，关注“小红书技术REDtech”

这就是素材

先让我们带着全局大图去感受下素材

提到广告业务就离不开一个关键词 —— IAA (In-app Ads)：平台一手向c端用户提供免费的服务，一只手向 b 端客户（广告主）售卖广告资源位，撮合用户和客户，赚些居间费，然后就可以用赚来的钱为用户提供更好更多的免费服务。如是，广告业务是 b 端客户、平台、c 端用户的三方博弈场，如何让这个游戏可持续发展？短期看金主爸爸（广告主）的投流 ROI，中期看用户体验，长期看社区调性，这时候素材显得格外重要（毕竟，广告主的投流表达手段就是出价、定向、素材的三板斧）：广告主向素材要效率，平台向素材要质量，用户用脚投票。

素材能给广告主带来什么？

举个例子，某一天收到一条拙劣诈骗短信“我是秦始皇，V我50”，我们会觉得不可思议：“现在的骗子怎么那么蠢！”，恭喜你，骗子眼中，你是个聪明人。越是拙劣的话术，越能过滤掉那些精明、麻烦的用户，广告里面把这个现象称作素材即定向。广告主追求投流 ROI，自然就有了动力制作一批让聪明人厌恶的素材，毕竟，维护这些人的体验感觉，对他好像也没有收益。

素材能给用户带来什么？

用户最初的目的就是来享受免费服务的，自然不愿被广告打扰，但是，最近恰巧想去散散心，你推给了他一个精品团，抑或是，广告告诉他现在年轻人都去看非洲大迁徙，他也觉得很有道理。满足或者激发一个需求，广告就不再是种打扰，似乎成了一种异样的免费服务，毕竟，免费得到了最新的流行趋势。

素材能给平台带来什么？

恰到好处的素材，大家其乐融融，用户抵触的素材，是会把用户推开的。卖广告主造血养活平台和留住用户才能有广告主，两者的因果关系有点鸡和蛋的意味。平台追求一个符合社区调性的素材，直觉上总没有错。好素材带给平台繁荣，坏的素材只会带来麻烦，不能 balance 商业效率和社区调性的素材，都应该是坏家伙。

行业的素材实践

先给两个结论：

素材的制作成本是投放生产中的大头（相比于友商，我们小红书更注重社区的调性，广告主的素材成本会更高）
广告主追求确定性的投流实践

不同媒体的调性是不同的，一套素材吃天下几乎不可能，目前的素材制作模式（自制 or 代理）：idea - 脚本 - 拍摄 - 领域专家人工介入 - 在线投放，显然，拍摄成本付出之后，才能有一定的判断结论，这时候，素材制作的成本已经付出。

制作好的素材要更高的成本

回到“如何让这个游戏可持续发展”的命题，等于在回答如何平衡商业效率和社区调性！答案也呼之欲出：“好的”素材的制作。生产实践中，素材是有成本的：制作成本 + 投流试错。至此，AIGC 的效率革命，是一个不错的实践选择。

先给几个 case

某代理商把素材制作的流程优化，通过 AIGC 的能力把专家介入时机提前：idea - 脚本 - AIGC生成 - 领域专家人工介入 - 拍摄 - 在线投放
某代理商在标题中使用关键词，将关键词自然融入标题且能够合理分布，以提高在搜索结果中的排名
某平台推出 AIGC 离线工具 + 在线组合优选的组合拳
某平台 spu 到素材的生成
某平台通过模糊素材内容，达到防爬&站外引流的业务目标
多模态特征级联到在线模型

归纳下收益路径

解决 0 - 1 投放问题：通过素材生产带来预算和场域之间的互通，进一步提升消耗，收益来源是引入预算，增加竞价密度，本质是放开约束
堆供给提升匹配效率：通过素材生产提升物料供给，带来消耗提升，收益来源是匹配效率的提升，本质是约束下堆多样性
提供工具赋能 b 端：辅助广告主提升创编效率

（【Tips】各家平台都在回答一个问题：平台做素材的优势在哪！）

技术视角总结下实践挑战

生产范式的幻觉挑战（一致性）：广告是一种商业行为，宝马的广告生成出一个奔驰的标题，显然是 0 容忍的红线事件
通用大模型到行业的适配性：营销感 vs 社区调性
多样性：在有限的广告内容中尽可能挖掘多样的标题，提高投放匹配效率

开局一张图，一致性、调性、多样性最关键：

一致性：可控生成 + 可用性RM
调性：领域预训练 + SFT
多样性：人群/笔记分层 + 可控生成 + 吸引力RM

业务建模

面向业务的可控生成

通用的生成一般是引入随机性生成多标题，但是我们的业务场景下，需要调和生成的随机性和业务的确定性，因此，我们实践：

训练：基于自动标注 (Auto-Labeling) - SFT (Supervised Fine-Tuning) 架构的可控生成训练范式
推理：构造一个级联框架，输入笔记，依次输出 推广对象 + 标题

基座模型的领域预训练

为了让基座模型适应小红书的领域特点，我们清洗得到亿级别笔记数据，并混合一定比例通用语料，对基座模型开展小红书领域继续预训练。而在模型选型上，我们从幻觉程度、标题吸引力两个方面进行评判，发现模型量级越大效果越好，结合线上部署推理成本，选用了 10B 量级模型。实验显示经过领域预训练，生成标题在相关性、幻觉抑制方面均得到提升。

基于大模型的自动标注

结合业务场景，我们考虑笔记、人群、标题风格三个可控生成维度，而难点在于如何获得训练数据。我们的做法是广泛利用合成数据，借助通用大模型的能力为笔记抽取推广对象，并标注笔记分层、人群分层以及标题风格，获得了笔记在不同卖点/人群下的关键词数据。为拿到对应标题，也进一步训练了关键词感知生成模型和风格感知生成模型，来分别产出笔记在各笔记/人群分层、各风格词下的标题。

关键词感知生成模型训练

训练目标是能根据给定关键词生成标题。为了解决训练数据匮乏的问题，我们首先用笔记原生标题训练小红书领域预训练模型，通过随机采样为每个笔记生成多个标题。然后利用通用大模型给标题抽取关键词，从而为每个笔记获得多组 <笔记 + 关键词, 标题> pair 数据，最后训练得到关键词感知生成模型。