OneRec翻译站点

10个月前发布 369 00

OneRec 是一款端到端生成式推荐模型，通过统一检索与排序流程、会话级生成和迭代偏好对齐，显著提升视频推荐质量并已在快手(Kuaishou)平台上线，助力 AI 工具使用者深入理解前沿推荐系统技术。

站点语言：

收录时间：

2025-06-22

打开网站手机查看

大模型最近收录AI # 端到端生成模型

OneRec

打开网站

在推荐技术从多级流水线向简洁、高效的方向变革时，OneRec应运而生。这一由快手(Kuaishou)团队提出的端到端生成式推荐框架，不仅统一了检索与排序流程，还在真实场景中取得显著效果。本文围绕模型结构、核心创新、应用效果和实用建议，为 AI 工具使用者全面解读 OneRec，提升关键词曝光与专业流量关注。

OneRec 是什么？

OneRec（One Recommendation）是由快手团队提出的首个端到端生成式推荐系统，于2025年2月发布 arXiv 论文。不同于传统“检索–排序”两阶段结构，OneRec 将推荐过程直接视为生成任务，通过编码用户历史行为并逐步生成一组候选视频，实现检索和排序的统一优化。

核心创新一览

端到端生成模型

OneRec 使用 encoder–decoder 架构，将用户历史行为编码为上下文，再自动生成一系列推荐结果。借助 sparse Mixture-of-Experts (MoE) 架构提升模型容量，同时控制计算开销。

会话级生成机制

不再逐项预测下一个视频，OneRec 实现会话级候选生成，保证输出视频组上下文连贯性，避免繁琐后处理。

Iterative Preference Alignment（IPA）与 DPO

OneRec 引入 迭代偏好对齐 (IPA) 模块，并结合 Direct Preference Optimization (DPO)，模拟用户反馈并优选样本以提升推荐质量。1% 的 DPO 样本即可带来显著推荐提升。

深度阅读 OneRec 技术细节

1. Sparse MoE 提升规模

OneRec 通过稀疏专家机制，在参数量级增大的情况下不显著增加 FLOPs，兼顾规模与效率。

2. 会话级生成结构

采用语义 ID token 化行为序列，decoder 解码一次性生成多个候选，替代逐项候选整合逻辑。

3. IPA + DPO 猎取偏好

设计 reward 模型模拟实际用户点击和观看行为，通过 DPO 迭代优化生成策略，显著提升用户满意度。

实际效果与部署表现

快手平台效果

部署于主 App 和 Lite 版本后：

用户观看时长提升 +1.6%
每次曝光平均观看时长增长 +6.5%
Lite 版本提升 +1.24%。

GPU 利用率提升

训练和推理阶段 MFU 分别达 23.7% 与 28.8%，为传统二阶段流水线的数倍。

成本效率显著

运行成本仅为传统流水线的 ~10%，支持高性能部署。

OneRec 的优势与挑战

优势

统一架构简化流水线，降低系统复杂性；
上下文连贯性更强，提升候选间逻辑一致；
用户偏好对齐优化效果明显；
真实部署场景效果突出。

挑战

生成准确率依赖高质量 token 表征；
MoE 结构部署需精细调优；
DPO 溯源机制需完善 reward 模型。

常见问题（FAQ）

Q1：OneRec 替代传统检索排序么？
A1： OneRec 成功集成两阶段逻辑于统一模型，但其设计仍可与检索器结合，具体由上线场景决定。

Q2：DPO 必须使用 IPA 吗？
A2： DPO 成果关键依赖 IPA reward 模型结合，会话化样本采样流程进一步放大偏好影响。

Q3：可用于长尾冷启动推荐吗？
A3： 会话级生成结合 MoE 和 DPO 提高冷启动和长尾召回能力，在实验中表现良好。

Q4：部署复杂度高吗？
A4： 虽 MoE 增加调优复杂性，但其高 GPU 利用率和成本节省显著；推荐结合流水线替代策略评估。

Q5：OneRec 可否用于非视频推荐？
A5： 架构通用、可复用于电商、内容推荐等场景，但需替换相应 item token 表征和偏好 reward 模型。

对比竞品

特性	OneRec	Anthropic Economic Index 等	DiscRec等大模型增强推荐（DiscRec）
架构	端到端内容生成	仍依赖检索排序流水线	混合 Gen + GNN 方法
优化方式	MoE + 会话生成 + DPO	依赖手工策略生成	专注增强 signal 嵌入
系统效率	高 GPU MFU，低成本	多阶段流水线效率低	GNN + LLM 联合提高 signal
部署规模	已在快手主 App 环境生产部署	尚处于研究或小规模测试阶段	大多在实验室阶段

实施建议

构建高质量行为 token：使用 semantic ID 分组成推荐编码；
MoE 结构优化选专家数量：平衡模型容量与资源成本；
开发通用 session 生成规范：增强输出连贯性；
设计实验奖励机制：构建 proxy reward 以支持 DPO；
逐步替换流水线模块：A/B 测试替换检索或排序阶段，降低上线风险。

展望未来

引入图神经与协同信号结合会话生成；
多模态 token（文本、行为、图像）丰富推荐语义；
通用化架构实现跨平台部署（电商、内容等）；
强化在线 learning 机制，实现更快反馈；
发布 OneRec API 与生态支持让更多平台受益。

小结

OneRec 凭借其突破性的生成推荐机制，集成检索与排序流程、采用会话级生成与偏好对齐优化，使推荐系统走向更通顺、高效与真实场景适配的方向。通过本文对模型原理、实际效果、实用建议的全面解读，期望能助力更多 AI 工具使用者理解并应用 OneRec，将推荐技术自由地导入自己的项目或研究场景中。

数据统计

OneRec访问数据评估

OneRec浏览人数已经达到369，如你需要查询该站的相关权重信息，可以点击"5118数据""爱站数据""Chinaz数据"进入；以目前的网站数据参考，建议以爱站数据为准，更多网站价值评估因素如：OneRec的访问速度、搜索引擎收录以及索引量、用户体验等；当然要评估一个站的价值，最主要还是需要根据您自身的需求以及需要，一些确切的数据则需要找OneRec的站长进行洽谈提供。如该站的IP、PV、UV、跳出率等！

特别声明

本站AI工具导航提供的OneRec页面内容基于公开资料、第三方工具目录与用户可访问信息整理，不代表官方立场，也不构成商业承诺或事实背书。内容均由chatgpt系列生成。同时，对于该外部链接的指向，不由AI工具导航实际控制，在2025年6月22日下午5:00收录时，该网页上的内容，都属于合规合法，后期网页的内容如出现违规，可以直接联系网站管理员进行删除，AI工具导航不承担任何责任。

AI工具导航致力于优质、实用的AI工具收集与分享！该AI工具地址https://navxd.com/sites/5738.html转载请注明

暂无评论

暂无评论...