OneRec 是快手推出的新型端到端生成式推荐系统。采用编码器-解码器架构,通过稀疏 Mixture-of-Experts(MoE)技术提升模型容量,保持高效的计算性能。与传统级联推荐系统不同,OneRec 使用会话式生成方法,能生成上下文连贯的推荐结果,通过迭代偏好对齐模块结合直接偏好优化(DPO),进一步提升推荐质量。在训练过程中,OneRec 将多模态表征量化为 token 序列输入模型,采用两阶段训练策略:先进行基础的 item 预测任务训练,再通过 DPO 进行偏好对齐。

OneRec – 快手推出的端到端生成式推荐系统  第1张
(图片来源网络,侵删)