当前浏览中

频道AI 大模型

浏览量23

▸ AI 大模型 · 公司 / 组织

DataChef 公司 / 组织

上海 AI Lab 与复旦大学开源的数据配方生成模型。

可用性

入口可访问

已记录官网或下载入口

信息核实

已验证

3 条来源，含 NavXD 收录

类型

网页工具

Web · 中文/多语言

GitHub收藏 0

收录 2026年5月20日更新 2026年5月20日浏览 23

// 01 DataChef 是什么

DataChef 是上海人工智能实验室与复旦大学联合推出的数据配方生成模型，主要用于自动生成大模型训练数据处理流水线。论文显示，DataChef-32B 可根据目标 benchmark 与候选数据源，自动完成数据选择、清洗、合成、配比与验证流程，并输出可执行 Python 数据处理代码。该项目通过在线强化学习与代理奖励机制优化数据配方生成，用于自动化 LLM Adaptation 与数据工程场景。官方已开源模型、代码与 Hugging Face Demo。

核心功能

自动生成数据配方
支持强化学习优化
输出可执行代码
支持数据清洗与配比
支持 Hugging Face Demo

使用场景

LLM 数据构建
模型微调
数据工程自动化
领域模型训练
AI 研究自动化

适合谁用

适合大模型研究人员与数据工程团队

// 02 核心功能

核心定位上海 AI Lab 与复旦大学开源的数据配方生成模型。
分类索引当前归档在最近收录AI，方便和同频工具横向比较。
能力标签关联标签包括 type:project、自动化、强化学习、verify:verified。
使用入口已记录可访问入口，可通过本页主按钮跳转。

// 03 使用场景

快速判断是否适合当前任务结合最近收录AI 定位和 type:project、自动化、强化学习标签，先判断它是否匹配你的工作流。
横向比较同类工具从相同分类和标签继续探索替代工具，减少只看单个产品带来的选择偏差。
沉淀工具选型资料把官网入口、平台、版本和 NavXD 标签合并成一页，适合做选型记录或团队分享。

// 04 常见问题

DataChef 是什么？

上海 AI Lab 与复旦大学开源的数据配方生成模型。

DataChef 适合哪些场景？

可优先参考它所属的最近收录AI 分类，以及 type:project、自动化、强化学习、verify:verified 等标签。

DataChef 是否提供可用入口？

本页已记录官网或下载入口，可通过顶部主按钮访问。

DataChef 支持哪些平台？

当前记录为网页工具，通常可通过浏览器访问。

// 05 资料来源

NavXD 收...https://navxd.com/navigation/sites/6715.html 官网或下载入口https://github.com/yichengchen24/DataChef 分类与标签体系最近收录AI、type:project、自动化、强化学习、verify:verified

KAT-Coder-Pro V2.5

快手 StreamLake 的仓库级编程 Agent 大模型，国内直连 API、按 Token 计费。

AI 编程AI 工具

AReaL 2.0

开源 agentic 强化学习训练框架：PPO/GRPO/DPO + 异步 RL + MoE 微调，含 Archon 引擎。

AI Agent / 智能体AI 工具

video-use

browser-use 团队开源：让编程 Agent 用代码剪辑视频。MIT，1.4万★。

AI 视频AI 工具

BrowserBC

快速结论 BrowserBC 是 Einsia 推出的浏览器自动化智能体（Web Agent）方案，核心思路是 […]

AI Agent / 智能体AI 工具

DataChef 公司 / 组织

// 01 DataChef 是什么

核心功能

使用场景

适合谁用

// 02 核心 功能

// 03 使用 场景

// 04 常见 问题

// 05 资料 来源

// 02 核心功能

// 03 使用场景

// 04 常见问题

// 05 资料来源