微信扫码
添加专属顾问
1. 大模型推荐技术发展回顾
2. 健康电商推荐背景与挑战
3. 大模型推荐在电商场的落地实践
分享嘉宾|张超 京东健康 推荐团队负责人
编辑整理|王嘉钰
内容校对|李瑶
出品社区|DataFun
01
目前,推荐系统关于“大模型”的结合存在三种主要技术思路:传统 CTR 模型不断做大、利用大语言模型在现有推荐各阶段进行增强,生成式大模型端到端解决推荐。
(1)传统 CTR 大模型
CTR 模型在推荐系统中逐渐向大规模化发展,模型复杂度方面,从简单的逻辑回归到复杂的深度学习模型,如 Wide & Deep、DeepFM、xDeepFM 等,提升了特征交互和非线性表示能力。数据规模上,利用大数据集进行训练,增强模型的泛化能力。在早期受限于算力,但随着技术进步,采用分布式计算和 GPU 加速,提升训练效率。CTR 模型不断变大的一个根本逻辑也是大家相信加深加宽的网络表达,海量的样本会对 ctr 模型更好的建模,其实也是在遵循 scaling law,虽然这个术语这两年才活起来,但其实 ctr 模型在 16 年工业界从 LR 转型 DNN 开始,就默认在 scaling 的路上不断发展。
(2)LLM 增强现有推荐技术
大语言模型凭借其丰富的 World Knowledge 和强大的理解能力,在数据样本和特征增强、U&I embedding 理解等方面对推荐系统进行了增强。在样本方面,LLM 通过生成高质量的商品描述和用户画像,有效缓解了冷启动问题,丰富了训练数据。在特征工程方面,LLM 利用其强大的自然语言处理能力,增强了对用户和商品文本信息的理解,生成更丰富、更精细的特征表示。在 embedding 表达方面,LLM 通过预训练和微调,捕捉用户的深层次兴趣和偏好,实现更精准的个性化推荐。
(3)生成式大模型
生成式大模型代表了一种颠覆性的变化,它从传统的多级过滤判别模式转变为端到端的生成模式,为推荐系统提供了全新的数据处理和内容生成能力,代表作就是 meta 最新的论文 Trillion-Parameter Sequential Transducers for Generative Recommendations.
“推荐”在其发展的各阶段曾遇到不同的瓶颈。
(1)阶段 1:卷数据
在 2010 年左右,推荐系统面临的主要瓶颈是数据量不足。当时处于 PC 时代,数据的体积(volume)、侧边信息(side info)、标签(label)远不如今天丰富。受限于产品设计,强账号产品较少,导致用户 ID、标签和特征都非常稀疏。直到 2013 年移动互联网的爆发,数据问题才得到缓解。在卷数据阶段,一个显著体验是,在论文发表和竞赛中,重点转向了寻找和清洗数据以及数据标注,然后再配合“竞赛神器”(各种树模型,如 GBDT 到 XGBoost)来取得成绩。
(2)阶段 2:卷网络表达
随着神经网络(NN)时代的到来,推荐系统开始从逻辑回归(LR)转向深度神经网络(DNN),这一转变标志着特征交叉表达的自动化。百度的大规模离散逻辑回归是浅层时代的代表作,奠定了后来发展的两个方向:高效的计算框架和精细的特征工程。各种工作把模型表达做精做细,如 Show+Click + MLP + UBM,以及主辅网络的交替训练。在神经网络时代,特征工程的工作从人工交给了网络结构,为了替代人工交叉,让模型自动学习特征的复杂交互,开启了一个模型不断扩展特征交叉表达的时代。
(3)阶段 3:卷算力 & 卷 Infra
Transformer 结构的出现,其天然可并行的“叠罗汉”结构为算力提供了扩展的条件。推荐系统开始设计适用于并行计算的网络结构,并在底层进行计算优化,以应对行为序列的丰富(长宽高)和特征交互的复杂性,这些都对算力和基础设施(Infra)提出了新的要求。与此同时,推荐场景对用户响应时间(RT)的容忍度远低于对话场景,这进一步推动了对推荐系统算力的高要求。
回顾完推荐系统曾经的发展瓶颈,我们再来看大模型的两个主要核心能力:scaling law 质变的涌现和 world knowledge 基础理解,这两个关键能力如何来解决推荐系统曾经面临的发展瓶颈。
(4)World Knowledge*数据瓶颈
①丰富样本
②数据预处理
通过构造合适的 prompt,抽取和转化原始信息,让 model 更容易拟合其与 label 的关系。比如,在医生推荐服务中,用户会输入一段患者主诉,但通常是口语化或非标准的,让 LLM 可以将其转化成更 medical level 的表述,以及抽取关键医学词汇,预处理后的输入对医生推荐的表现有极大提升。
①LLM embedding 直接使用
②Embedding pre-load for finetune
(6)Scaling law*NN 表达瓶颈
①Scaling Law 对召回的启示:
I2I 召回通常面临做深和做宽的问题,做深是指对于 item1,不仅 top100 是准的,top1w 也是准的,这对多候选池场景通用一套 i2i 是非常重要的;做宽是指除了头部 item 训练比较准,长尾的 item 也需要做到相对不错的准度;解决以上挑战的手段本质就是 scaling law 的各种方法,样本规模的扩大,i2i model 参数的增大,epoch 增多等,以上可以充分解决上述挑战。
②Scaling law 对精排的启示:
(7)Scaling law*算力&infra 瓶颈
①与 Scaling Law 同步适配算力和基础设施不断提升
随着大模型的 Scaling Law,算力和基础设施也在不断进化。推荐系统可以设计为更适合并行计算的结构,同时利用底层计算优化来提高效率。
②利用生成式建模和基础设施优化
通过生成式建模,可以在推荐系统中实现从同质数据空间到异质数据全空间的统一表示。此外,通过基础设施的优化,比如使用 Mixture of Experts(MoE)等技术,可以在保持模型复杂性的同时加速推理过程。
通过上述方法,大模型技术能够有效解决推荐系统在数据、网络表达瓶颈,并且反向推动算力基础设施提升,推动推荐系统向更高效、更准确的方向发展。
02
在当前的电商环境中,消费者几乎每天都会使用各种购物应用程序,如小红书、京东、淘宝、天猫等。尽管这些平台在用户体验上有很多相似之处,但在健康产品这一细分市场中,推荐系统面临着独特的挑战和特点。
泛健康商品,包括营养保健品、OTC、口罩、温度计等,与传统的零售商品相比,具有明显的刚需和知识驱动特性。例如,消费者购买维生素 C 时,其决策过程往往与其对维生素 C 的知识以及是否是其当前需要,而不是基于多样化的兴趣选择。这意味着健康商品的推荐应当更多地依赖于知识导向和刚需满足。
泛健康商品,存在很大一部分标品。标品指的是有明确标准和约束,比如限定成分、规格或明确功效等的商品。比如 N95 口罩是标品,polo 衫是非标品。标品在 SKU(最小粒度商品)层面的差异性较小,消费者选择时的个性化需求并不显著,其个性化主要是在标品类别的选择上。而 LLM 对标品的理解是充分的,但无法对齐其对 skuid 的理解(一个标品包含成百上千的 skuid)。因此,LLM 结合健康推荐系统可以采用 two-stage 策略:首先推荐符合刚需和知识导向的标品,然后在标品下为用户推荐合适的 SKU。
除了上述特点外,健康产品推荐系统还面临着其他挑战,如低频购买、用户稀疏行为、场景差异性大等。这些问题普遍存在于推荐系统中,需要通过精细化的算法和深入的用户理解来解决。
健康产品推荐系统在电商领域中占有重要地位,其成功实施需要对刚需和知识驱动的深入理解,以及对标品特性的有效利用。通过解决上述挑战,推荐系统能够为用户提供更加精准和个性化的健康产品推荐。
03
在电商推荐系统中,大模型技术的落地实践主要聚焦于解决用户个性化推荐的问题,尤其是在京东健康(JDH)这一特定领域。下面介绍大模型技术在电商推荐中的几个关键落地实践。
(1)问题背景
在电商推荐系统中,新用户和低频用户由于行为数据不足,难以通过传统算法实现有效召回。这部分用户的推荐质量直接影响了平台的用户体验和业务增长。
(2)解决思路
利用大语言模型的世界知识:大模型能够根据用户的基本信息,如年龄、居住地和健康记录,推断用户可能的需求和兴趣点,这种能力有助于理解用户潜在的刚需和知识驱动的购买行为。
结合领域样本数据:仅依靠大模型的通用知识是不够的,必须结合特定领域的样本数据,以缩小世界知识与领域知识之间的差距,这要求对大模型进行任务对齐,确保推荐系统能够准确地响应用户的具体需求。
推理性能优化:在召回过程中,传统的 Item-to-Item(I2I)推荐可能仅需十几毫秒。然而,如果引入大模型进行推理,可能会导致显著的性能下降。为此,需要探索从离线到近线处理的升级方案,以减少覆盖率的损失并保证系统的响应速度。
(3)技术挑战
物料表达:大模型通常处理自然语言 token,而推荐系统中使用的是 ID。需要找到一种方法,使物料的表达既能够保持语义信息,又具有足够的区分度。
任务对齐:需要将特定领域的推荐样本与大模型的任务进行有效对齐,确保推荐结果的准确性。
推理效率:面对大模型可能带来的推理延迟,需要优化推理过程,以满足在线推荐系统对实时性的要求。
(4)实施策略
采用两阶段建模方法,首先利用大模型生成潜在感兴趣的产品名称,然后根据产品名推荐具体的 SKU。在生成产品名称(PU)时,通过过滤机制确保推荐结果与现有库存和用户需求相匹配。通过 Prompt 工程技术优化大模型的输入,提高模型对特定领域任务的响应能力。
(5)数学建模
\[ \text{SU} = \{ \text{sku} | \text{EE}(\text{pu}, \text{sku}) \geq \epsilon \} \]
\[ \text{pu} = G(\text{u, cxt}) | f(\text{P, G}) \geq \theta \]
其中,\( \text{SU} \) 表示给定标品p,召回用户 u 感兴趣的 sku 列表;\( \text{EE} \) 是筛选得分高的 sku 的方式;\( \text{pu} \) 表示生成式的方式产出“可能”的标品集合;\( f(\text{P, G}) \) 表示生成商品和真实商品的匹配度。
(6)系统实现
包括 Prompt Engineering、特征选择、样本选择、模型调优等步骤,以实现高效的个性化推荐。
LLM4CB 的建模采用两阶段方法:
其它说明:
①LLM 全量调参还是换 softmax frozen LLM,不同场景值得大家探索,为了对世界知识的最大保留,该场景选择了前者。
②性能优化:通过异步推理和 KV 存储,提高系统的实时性和覆盖率。
③样本多样性:确保样本选择的多样性,以引导模型学习。
④异步推理+KV 存储:对用户请求进行异步处理,使用键值存储方式,提高响应速度。
(7)结果与展望
通过 LLM4CB 的实施,显著提升了对稀疏行为用户的召回效果,尤其是在长尾或低频用户群体中。微调策略的优化不仅提高了推荐的相关性,也为模型在特定领域的应用提供了灵活性和适应性。我们期待通过持续的技术创新,进一步提升推荐系统的性能和用户体验。
为了解决长尾场景下的推荐问题,我们采用了 DeepI2I 模型,这是一种扩展的 Item-to-Item(I2I)推荐模型。通过增加样本数量、参数量和 epoch,我们利用图神经网络(GNN)的随机游走技术来构造低频商品的样本,同时运用大型语言模型(LLM)进行数据增强。这种策略不仅提高了模型对低频商品的捕捉能力,也增强了模型对用户偏好的深入理解。
在点击率预测(CTR)模型中,我们通过增加模型的复杂度和计算规模,以适应长序列、多模态、多目标等复杂推荐任务的需求。这一策略体现了 Scaling Law 的应用,即通过扩大模型规模来提升性能。我们的 CTR 模型已经从存储密集型转向计算密集型,以处理更大规模的数据和更复杂的特征交互。
最后,我们提出了一个开放性问题:生成式推荐范式是否有可能取代传统的多级过滤加判别式范式,并在电商推荐系统中大规模落地?电商推荐系统是一个复杂的系统性工程,涉及供给、分发、营销等多个方面,不是单一技术问题。虽然大型语言模型在推荐系统中显示出了潜力,但是否能完全替代现有的多阶段判别式方法,还需要更多的研究和实践来验证。
个人观点
随着技术的不断进步,我们预计 Scaling Law 将在推荐系统中发挥更大的作用,推动个性化推荐技术向更深层次发展。
京东健康推荐团队通过大模型技术在电商领域的落地实践,展示了如何结合世界知识和领域知识,解决稀疏行为用户的召回问题,并通过技术创新不断提升推荐系统的性能和用户体验。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-07-02
从一个售前场景开始:一次组织级 AI 落地项目复盘
2026-07-01
半小时,100页标书,AI替你熬的夜
2026-07-01
被AI识破的“分工陷阱”:为什么前端部署工程师本质就是销售?
2026-06-27
人人都在抢邮件和私信,却忘了那个打开率最高的老渠道——还没人用AI做好
2026-06-25
Codex最强替代!我用这款全场景Agent搞定整套营销方案
2026-06-24
装修、服装、家具,正在用 AI 把生意讲清楚
2026-06-16
万字长文|AI 正在重塑营销范式:未来市场部,不是提效,而是重构组织方式(上篇)
2026-06-08
AI营销,开始翻车了
2026-04-20
2026-04-27
2026-04-07
2026-05-11
2026-05-07
2026-06-01
2026-05-26
2026-06-08
2026-05-25
2026-06-16
2026-07-01
2026-03-16
2026-01-25
2025-09-30
2025-06-26
2025-06-15
2025-06-03
2025-05-29
欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。
在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。
一、 定义
本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。
会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。
知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。
二、 账号注册与登录
登录方式:本网站支持以下登录方式,您可根据实际情况选择:
微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。
手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。
账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。
实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。
未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。
三、 服务内容与规范
知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。
服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。
禁止行为:您在使用服务时不得实施以下行为:
利用技术手段批量爬取、下载、转存知识库内容;
将知识库内容用于商业目的或未经授权地向第三方传播;
干扰本网站正常运行或侵犯其他用户合法权益;
发布违法违规信息或从事违反公序良俗的活动。
四、 知识产权声明
权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。
有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。
侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。
五、 个人信息保护
我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。
您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。
您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。
六、 免责声明
内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。
不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。
第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。
七、 违约责任
如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。
如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。
八、 法律适用与争议解决
本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。
因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。
九、 其他
本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。
本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。
我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。