CURRENTVIEWING
CH最近收录AI
VIEWS6
▸ 最近收录AI · SITES

DataChef SITES

上海 AI Lab 与复旦大学开源的数据配方生成模型。

可用性
入口可访问
已记录官网或下载入口
信息核实
已验证
3 条来源,含 NavXD 收录
类型
网页工具
Web · 中文/多语言
收录 2026年5月20日更新 2026年5月20日浏览 6

// 01 DataChef 是什么

DataChef 是上海人工智能实验室与复旦大学联合推出的数据配方生成模型,主要用于自动生成大模型训练数据处理流水线。论文显示,DataChef-32B 可根据目标 benchmark 与候选数据源,自动完成数据选择、清洗、合成、配比与验证流程,并输出可执行 Python 数据处理代码。该项目通过在线强化学习与代理奖励机制优化数据配方生成,用于自动化 LLM Adaptation 与数据工程场景。官方已开源模型、代码与 Hugging Face Demo。

核心功能

  • 自动生成数据配方
  • 支持强化学习优化
  • 输出可执行代码
  • 支持数据清洗与配比
  • 支持 Hugging Face Demo

使用场景

  • LLM 数据构建
  • 模型微调
  • 数据工程自动化
  • 领域模型训练
  • AI 研究自动化

适合谁用

适合大模型研究人员与数据工程团队

常见问题

**Q: DataChef 是什么?**

DataChef 是用于自动生成 LLM 数据处理流水线的开源模型。

**Q: DataChef 怎么用?**

开发者可通过 GitHub 与 Hugging Face 使用模型与生成工具。

**Q: DataChef 收费吗?**

项目已开源,可免费使用。

资料来源

  • https://github.com/yichengchen24/DataChef
  • https://arxiv.org/abs/2602.11089
  • https://ai-bot.cn/datachef/

// 02 核心 功能

  • 核心定位上海 AI Lab 与复旦大学开源的数据配方生成模型。
  • 分类索引当前归档在 最近收录AI,方便和同频工具横向比较。
  • 能力标签关联标签包括 type:project、自动化、强化学习、LLM训练、verify:verified、上海AI Lab。
  • 使用入口已记录可访问入口,可通过本页主按钮跳转。

// 03 使用 场景

  • 快速判断是否适合当前任务结合 最近收录AI 定位和 type:project、自动化、强化学习 标签,先判断它是否匹配你的工作流。
  • 横向比较同类工具从相同分类和标签继续探索替代工具,减少只看单个产品带来的选择偏差。
  • 沉淀工具选型资料把官网入口、平台、版本和 NavXD 标签合并成一页,适合做选型记录或团队分享。

// 04 常见 问题

DataChef 是什么?
上海 AI Lab 与复旦大学开源的数据配方生成模型。
DataChef 适合哪些场景?
可优先参考它所属的 最近收录AI 分类,以及 type:project、自动化、强化学习、LLM训练、verify:verified 等标签。
DataChef 是否提供可用入口?
本页已记录官网或下载入口,可通过顶部主按钮访问。
DataChef 支持哪些平台?
当前记录为网页工具,通常可通过浏览器访问。

// 05 资料 来源

同频段 更多信号

查看 最近收录AI 全部