OneRec翻译站点

7个月前发布 258 00

OneRec 是一款端到端生成式推荐模型,通过统一检索与排序流程、会话级生成和迭代偏好对齐,显著提升视频推荐质量并已在快手(Kuaishou)平台上线,助力 AI 工具使用者深入理解前沿推荐系统技术。

站点语言:
en
收录时间:
2025-06-22
问小白

在推荐技术从多级流水线向简洁、高效的方向变革时,OneRec应运而生。这一由快手(Kuaishou)团队提出的端到端生成式推荐框架,不仅统一了检索与排序流程,还在真实场景中取得显著效果。本文围绕模型结构、核心创新、应用效果和实用建议,为 AI 工具使用者全面解读 OneRec,提升关键词曝光与专业流量关注。


OneRec 是什么?

OneRec(One Recommendation)是由快手团队提出的首个端到端生成式推荐系统,于2025年2月发布 arXiv 论文。不同于传统“检索–排序”两阶段结构,OneRec 将推荐过程直接视为生成任务,通过编码用户历史行为并逐步生成一组候选视频,实现检索和排序的统一优化。


核心创新一览

端到端生成模型

OneRec 使用 encoder–decoder 架构,将用户历史行为编码为上下文,再自动生成一系列推荐结果。借助 sparse Mixture-of-Experts (MoE) 架构提升模型容量,同时控制计算开销

会话级生成机制

不再逐项预测下一个视频,OneRec 实现会话级候选生成,保证输出视频组上下文连贯性,避免繁琐后处理

Iterative Preference Alignment(IPA)与 DPO

OneRec 引入 迭代偏好对齐 (IPA) 模块,并结合 Direct Preference Optimization (DPO),模拟用户反馈并优选样本以提升推荐质量。1% 的 DPO 样本即可带来显著推荐提升


深度阅读 OneRec 技术细节

1. Sparse MoE 提升规模

OneRec 通过稀疏专家机制,在参数量级增大的情况下不显著增加 FLOPs,兼顾规模与效率

2. 会话级生成结构

采用语义 ID token 化行为序列,decoder 解码一次性生成多个候选,替代逐项候选整合逻辑

3. IPA + DPO 猎取偏好

设计 reward 模型模拟实际用户点击和观看行为,通过 DPO 迭代优化生成策略,显著提升用户满意度


实际效果与部署表现

快手平台效果

部署于主 App 和 Lite 版本后:

  • 用户观看时长提升 +1.6%

  • 每次曝光平均观看时长增长 +6.5%

  • Lite 版本提升 +1.24%

GPU 利用率提升

训练和推理阶段 MFU 分别达 23.7% 与 28.8%,为传统二阶段流水线的数倍

成本效率显著

运行成本仅为传统流水线的 ~10%,支持高性能部署


OneRec 的优势与挑战

优势

  • 统一架构简化流水线,降低系统复杂性;

  • 上下文连贯性更强,提升候选间逻辑一致;

  • 用户偏好对齐优化效果明显

  • 真实部署场景效果突出

挑战

  • 生成准确率依赖高质量 token 表征

  • MoE 结构部署需精细调优

  • DPO 溯源机制需完善 reward 模型


常见问题(FAQ)

Q1:OneRec 替代传统检索排序么?
A1: OneRec 成功集成两阶段逻辑于统一模型,但其设计仍可与检索器结合,具体由上线场景决定。

Q2:DPO 必须使用 IPA 吗?
A2: DPO 成果关键依赖 IPA reward 模型结合,会话化样本采样流程进一步放大偏好影响。

Q3:可用于长尾冷启动推荐吗?
A3: 会话级生成结合 MoE 和 DPO 提高冷启动和长尾召回能力,在实验中表现良好。

Q4:部署复杂度高吗?
A4: 虽 MoE 增加调优复杂性,但其高 GPU 利用率和成本节省显著;推荐结合流水线替代策略评估。

Q5:OneRec 可否用于非视频推荐?
A5: 架构通用、可复用于电商、内容推荐等场景,但需替换相应 item token 表征和偏好 reward 模型。


对比竞品

特性OneRecAnthropic Economic Index 等DiscRec等大模型增强推荐(DiscRec)
架构端到端内容生成仍依赖检索排序流水线混合 Gen + GNN 方法
优化方式MoE + 会话生成 + DPO依赖手工策略生成专注增强 signal 嵌入
系统效率高 GPU MFU,低成本多阶段流水线效率低GNN + LLM 联合提高 signal
部署规模已在快手主 App 环境生产部署尚处于研究或小规模测试阶段大多在实验室阶段

实施建议

  1. 构建高质量行为 token:使用 semantic ID 分组成推荐编码;

  2. MoE 结构优化选专家数量:平衡模型容量与资源成本;

  3. 开发通用 session 生成规范:增强输出连贯性;

  4. 设计实验奖励机制:构建 proxy reward 以支持 DPO;

  5. 逐步替换流水线模块:A/B 测试替换检索或排序阶段,降低上线风险。


展望未来

  • 引入图神经与协同信号结合会话生成;

  • 多模态 token(文本、行为、图像)丰富推荐语义;

  • 通用化架构实现跨平台部署(电商、内容等);

  • 强化在线 learning 机制,实现更快反馈;

  • 发布 OneRec API 与生态支持让更多平台受益。


小结

OneRec 凭借其突破性的生成推荐机制,集成检索与排序流程、采用会话级生成与偏好对齐优化,使推荐系统走向更通顺、高效与真实场景适配的方向。通过本文对模型原理、实际效果、实用建议的全面解读,期望能助力更多 AI 工具使用者理解并应用 OneRec,将推荐技术自由地导入自己的项目或研究场景中。

数据统计

OneRec访问数据评估

OneRec浏览人数已经达到258,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议以爱站数据为准,更多网站价值评估因素如:OneRec的访问速度、搜索引擎收录以及索引量、用户体验等;当然要评估一个站的价值,最主要还是需要根据您自身的需求以及需要,一些确切的数据则需要找OneRec的站长进行洽谈提供。如该站的IP、PV、UV、跳出率等!

关于OneRec特别声明

本站AI工具导航提供的OneRec页面内容基于公开资料、第三方工具目录与用户可访问信息整理,不代表官方立场,也不构成商业承诺或事实背书。内容均由chatgpt系列生成。同时,对于该外部链接的指向,不由AI工具导航实际控制,在2025年6月22日 下午5:00收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,AI工具导航不承担任何责任。

相关AI工具平替

提示词商城

暂无评论

none
暂无评论...