在推荐技术从多级流水线向简洁、高效的方向变革时,OneRec应运而生。这一由快手(Kuaishou)团队提出的端到端生成式推荐框架,不仅统一了检索与排序流程,还在真实场景中取得显著效果。本文围绕模型结构、核心创新、应用效果和实用建议,为 AI 工具使用者全面解读 OneRec,提升关键词曝光与专业流量关注。
OneRec 是什么?
OneRec(One Recommendation)是由快手团队提出的首个端到端生成式推荐系统,于2025年2月发布 arXiv 论文。不同于传统“检索–排序”两阶段结构,OneRec 将推荐过程直接视为生成任务,通过编码用户历史行为并逐步生成一组候选视频,实现检索和排序的统一优化。
核心创新一览
端到端生成模型
OneRec 使用 encoder–decoder 架构,将用户历史行为编码为上下文,再自动生成一系列推荐结果。借助 sparse Mixture-of-Experts (MoE) 架构提升模型容量,同时控制计算开销。
会话级生成机制
不再逐项预测下一个视频,OneRec 实现会话级候选生成,保证输出视频组上下文连贯性,避免繁琐后处理 。
Iterative Preference Alignment(IPA)与 DPO
OneRec 引入 迭代偏好对齐 (IPA) 模块,并结合 Direct Preference Optimization (DPO),模拟用户反馈并优选样本以提升推荐质量。1% 的 DPO 样本即可带来显著推荐提升。
深度阅读 OneRec 技术细节
1. Sparse MoE 提升规模
OneRec 通过稀疏专家机制,在参数量级增大的情况下不显著增加 FLOPs,兼顾规模与效率。
2. 会话级生成结构
采用语义 ID token 化行为序列,decoder 解码一次性生成多个候选,替代逐项候选整合逻辑。
3. IPA + DPO 猎取偏好
设计 reward 模型模拟实际用户点击和观看行为,通过 DPO 迭代优化生成策略,显著提升用户满意度。
实际效果与部署表现
快手平台效果
部署于主 App 和 Lite 版本后:
用户观看时长提升 +1.6%
每次曝光平均观看时长增长 +6.5%
Lite 版本提升 +1.24%。
GPU 利用率提升
训练和推理阶段 MFU 分别达 23.7% 与 28.8%,为传统二阶段流水线的数倍。
成本效率显著
运行成本仅为传统流水线的 ~10%,支持高性能部署 。
OneRec 的优势与挑战
优势
统一架构简化流水线,降低系统复杂性;
上下文连贯性更强,提升候选间逻辑一致;
用户偏好对齐优化效果明显;
真实部署场景效果突出。
挑战
生成准确率依赖高质量 token 表征;
MoE 结构部署需精细调优;
DPO 溯源机制需完善 reward 模型。
常见问题(FAQ)
Q1:OneRec 替代传统检索排序么?
A1: OneRec 成功集成两阶段逻辑于统一模型,但其设计仍可与检索器结合,具体由上线场景决定。
Q2:DPO 必须使用 IPA 吗?
A2: DPO 成果关键依赖 IPA reward 模型结合,会话化样本采样流程进一步放大偏好影响。
Q3:可用于长尾冷启动推荐吗?
A3: 会话级生成结合 MoE 和 DPO 提高冷启动和长尾召回能力,在实验中表现良好。
Q4:部署复杂度高吗?
A4: 虽 MoE 增加调优复杂性,但其高 GPU 利用率和成本节省显著;推荐结合流水线替代策略评估。
Q5:OneRec 可否用于非视频推荐?
A5: 架构通用、可复用于电商、内容推荐等场景,但需替换相应 item token 表征和偏好 reward 模型。
对比竞品
| 特性 | OneRec | Anthropic Economic Index 等 | DiscRec等大模型增强推荐(DiscRec) |
|---|---|---|---|
| 架构 | 端到端内容生成 | 仍依赖检索排序流水线 | 混合 Gen + GNN 方法 |
| 优化方式 | MoE + 会话生成 + DPO | 依赖手工策略生成 | 专注增强 signal 嵌入 |
| 系统效率 | 高 GPU MFU,低成本 | 多阶段流水线效率低 | GNN + LLM 联合提高 signal |
| 部署规模 | 已在快手主 App 环境生产部署 | 尚处于研究或小规模测试阶段 | 大多在实验室阶段 |
实施建议
构建高质量行为 token:使用 semantic ID 分组成推荐编码;
MoE 结构优化选专家数量:平衡模型容量与资源成本;
开发通用 session 生成规范:增强输出连贯性;
设计实验奖励机制:构建 proxy reward 以支持 DPO;
逐步替换流水线模块:A/B 测试替换检索或排序阶段,降低上线风险。
展望未来
引入图神经与协同信号结合会话生成;
多模态 token(文本、行为、图像)丰富推荐语义;
通用化架构实现跨平台部署(电商、内容等);
强化在线 learning 机制,实现更快反馈;
发布 OneRec API 与生态支持让更多平台受益。
小结
OneRec 凭借其突破性的生成推荐机制,集成检索与排序流程、采用会话级生成与偏好对齐优化,使推荐系统走向更通顺、高效与真实场景适配的方向。通过本文对模型原理、实际效果、实用建议的全面解读,期望能助力更多 AI 工具使用者理解并应用 OneRec,将推荐技术自由地导入自己的项目或研究场景中。
数据统计
OneRec访问数据评估
本站AI工具导航提供的OneRec页面内容基于公开资料、第三方工具目录与用户可访问信息整理,不代表官方立场,也不构成商业承诺或事实背书。内容均由chatgpt系列生成。同时,对于该外部链接的指向,不由AI工具导航实际控制,在2025年6月22日 下午5:00收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,AI工具导航不承担任何责任。



