什么是ML‑Master
ML‑Master 是由上海交通大学人工智能学院 Agents 团队在 2025 年发布的一款 AI‑for‑AI(AI 自主发展)智能体,目标通过“探索–推理”深度结合机制,实现 AI 系统对自身进行持续演进。该系统通过构建自适应记忆,将探索产生的经验纳入推理过程,形成“探索→推理→优化→再探索”的闭环体系。
在 OpenAI MLE‑Bench 基准测试中,ML‑Master 获得 29.3% 的平均奖牌率,显著优于此前的 SOTA 方法,尤其在中等复杂度任务上实现超越,奖牌率达到 20.2%。
背景与目标定位
随着 AI 系统向“自主研发 AI”方向进化,传统 LLM Agent 多为流程驱动,难以充分纳入探索经验,往往导致“试错信息丢失”或推理无法借力历史经验 。
上海交大团队提出 ML‑Master,通过平衡探索与推理模块协作,以及自适应记忆机制,实现将历史探索经验系统性注入推理中,并将推理结论反馈探索,实现 AI 自我进化。
核心技术与架构解析
平衡多轨迹探索(Balanced Multi‑Trajectory Exploration)
类似 Monte Carlo Tree Search 构建多路径探索树,同时并行搜索多个可能解决路径;
系统按照潜力与覆盖度为各路径分配资源,防止陷入局部最优。
可控推理(Steerable Reasoning)
深度语言模型(如 DeepSeek‑R1 或其他 LLM)在推理模块中接入自适应记忆,形成条件推理;
模型非盲推理,而是以探索经验为基础构建分析逻辑,从而降低幻觉与误判风险。
自适应记忆机制(Adaptive Memory)
自动收集执行反馈、代码片段、性能指标等探索信息;
结合父节点和兄弟路径重要信息,对记忆进行过滤与精简;
将记忆注入到下次推理中,从而构成动态经验库。
实验评测与性能表现
OpenAI MLE‑Bench 基准测试
平均奖牌率:29.3%,领先如 R&D‑Agent(22.4%)、AIDE(16.9%)等;
中等任务奖牌:20.2%,超过此前 9.0% 的 SOTA 方法两倍以上;
时间成本:仅用 12 小时完成基准测试评估,相比其他方法节约 50% 运行成本。
这些结果体现了 ML‑Master 在效率与质量上的全面领先。
技术创新亮点
1.探索与推理深度融合:非线性分割流程,而是闭环协同,效能提升显著。
2.自适应记忆机制:长期记忆替代单次输入,推理更具历史深度。
3.动态资源分配策略:并行路径探索机制突破效率瓶颈。
4.高效实用性:在有限时间内完成复杂任务,适合工业场景。
架构流程与用户接入建议
克隆项目并安装依赖:github.com/sjtu‑sai‑agents/ML‑Master;
配置环境:预训练模型、推理引擎等;
设置多轨迹探索参数:包括最大路径数、预算限制;
选择推理模型与记忆策略;
运行 MLE‑Bench 或自定义任务;
收集执行结果并构建记忆,可迭代优化。
支持部署于本地服务器或云端,通过项目主页可获取后续评测和工具集。
应用场景与适用用户
自动化 ML 系统研发:替代人工在模型训练、特征工程、调参等环节中的重复劳动;
AI 工具研制:构建 AI4AI 驱动系统,用于自动代码生成与 Pipeline 优化;
研究演示平台:高校与实验室可用于 AI 代理、记忆机制、探索策略教学;
工业自动调优:节约人工成本,同时提升系统稳定性。
优势与改进方向
| 维度 | 优势 | 需改进方向 |
|---|---|---|
| 效率与质量 | 并行探索 + 猜测记忆机制 实现高奖牌率 | 推理计算成本仍较高 |
| 自主演进 | 闭环机制令系统迭代能力持续增强 | 长期实验中记忆冗余问题 |
| 开源生态 | 项目积极推进代码与文档更新 | 尚无 GUI 工具或可视化界面 |
| 部署复杂度 | 支持多机并行 | 对硬件环境与依赖配置敏感 |
常见问题(FAQ)
问:ML‑Master 能自主学习吗?
答:能通过探索-推理闭环迭代优化任务方案,具备一定自我演进能力。
问:适合零基础用户使用吗?
答:技术门槛较高,适合有 ML 工程经验或团队使用。
问:能应用于商业项目吗?
答:可作为系统底座,但需补充界面层与任务适配模块。
问:配合哪些 LLM 可提升性能?
答:建议使用高性能模型如 DeepSeek‑R1 或 GPT‑4o‑mini 等。
问:与 X‑Master 系列关系如何?
答:同属 SJTU-SAI‑Agents 项目线,是专注 ML 工程任务的 AI4AI 分支。
总结与建议
ML‑Master 以“探索+推理 + 记忆”三轮闭环体系,引领 AI4AI 的技术路线,实现了大型模型自主研发 AI 的能力突破。其在 MLE‑Bench 基准下取得 SOTA 成绩,展现出卓越性能与效率。
数据统计
ML‑Master访问数据评估
本站AI工具导航提供的ML‑Master页面内容基于公开资料、第三方工具目录与用户可访问信息整理,不代表官方立场,也不构成商业承诺或事实背书。内容均由chatgpt系列生成。同时,对于该外部链接的指向,不由AI工具导航实际控制,在2025年7月10日 下午4:53收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,AI工具导航不承担任何责任。
相关AI工具平替
星野
Aithor
PageAI
Gemma 3n
Foyr Neo
JoyAgent‑JDGenie




