当前浏览中
频道AI Agent / 智能体
浏览量200
▸ AI Agent / 智能体 · AI 智能体

ML‑Master AI 智能体

ML‑Master 是上海交通大学人工智能学院提出的 AI‑for‑AI 智能体,创新融合探索与推理,通过自适应记忆机制在 OpenAI MLE‑Bench 上取得 29.3% 奖牌率,性能全流程领先,适合 AI 工具使用者构建自主进化 AI 系统。

可用性
入口可访问
已记录官网或下载入口
信息核实
已验证
3 条来源,含 NavXD 收录
类型
网页工具
Web · en
收录 2025年7月10日更新 2025年7月10日浏览 200

// 01 ML‑Master 是什么

ML‑Master 界面截图
ML‑Master · 界面预览

什么是ML‑Master

ML‑Master 是由上海交通大学人工智能学院 Agents 团队在 2025 年发布的一款 AI‑for‑AI(AI 自主发展)智能体,目标通过“探索–推理”深度结合机制,实现 AI 系统对自身进行持续演进。该系统通过构建自适应记忆,将探索产生的经验纳入推理过程,形成“探索→推理→优化→再探索”的闭环体系

在 OpenAI MLE‑Bench 基准测试中,ML‑Master 获得 29.3% 的平均奖牌率,显著优于此前的 SOTA 方法,尤其在中等复杂度任务上实现超越,奖牌率达到 20.2%


背景与目标定位

随着 AI 系统向“自主研发 AI”方向进化,传统 LLM Agent 多为流程驱动,难以充分纳入探索经验,往往导致“试错信息丢失”或推理无法借力历史经验

上海交大团队提出 ML‑Master,通过平衡探索与推理模块协作,以及自适应记忆机制,实现将历史探索经验系统性注入推理中,并将推理结论反馈探索,实现 AI 自我进化。


核心技术与架构解析

平衡多轨迹探索(Balanced Multi‑Trajectory Exploration)

  • 类似 Monte Carlo Tree Search 构建多路径探索树,同时并行搜索多个可能解决路径;

  • 系统按照潜力与覆盖度为各路径分配资源,防止陷入局部最优。

可控推理(Steerable Reasoning)

  • 深度语言模型(如 DeepSeek‑R1 或其他 LLM)在推理模块中接入自适应记忆,形成条件推理;

  • 模型非盲推理,而是以探索经验为基础构建分析逻辑,从而降低幻觉与误判风险

自适应记忆机制(Adaptive Memory)

  • 自动收集执行反馈、代码片段、性能指标等探索信息;

  • 结合父节点和兄弟路径重要信息,对记忆进行过滤与精简;

  • 将记忆注入到下次推理中,从而构成动态经验库。


实验评测与性能表现

OpenAI MLE‑Bench 基准测试

  • 平均奖牌率:29.3%,领先如 R&D‑Agent(22.4%)、AIDE(16.9%)等

  • 中等任务奖牌:20.2%,超过此前 9.0% 的 SOTA 方法两倍以上;

  • 时间成本:仅用 12 小时完成基准测试评估,相比其他方法节约 50% 运行成本

这些结果体现了 ML‑Master 在效率与质量上的全面领先。


技术创新亮点

1.探索与推理深度融合:非线性分割流程,而是闭环协同,效能提升显著。

2.自适应记忆机制:长期记忆替代单次输入,推理更具历史深度。

3.动态资源分配策略:并行路径探索机制突破效率瓶颈。

4.高效实用性:在有限时间内完成复杂任务,适合工业场景。


架构流程与用户接入建议

  1. 克隆项目并安装依赖:github.com/sjtu‑sai‑agents/ML‑Master;

  2. 配置环境:预训练模型、推理引擎等;

  3. 设置多轨迹探索参数:包括最大路径数、预算限制;

  4. 选择推理模型与记忆策略

  5. 运行 MLE‑Bench 或自定义任务

  6. 收集执行结果并构建记忆,可迭代优化

支持部署于本地服务器或云端,通过项目主页可获取后续评测和工具集。


应用场景与适用用户

  • 自动化 ML 系统研发:替代人工在模型训练、特征工程、调参等环节中的重复劳动;

  • AI 工具研制:构建 AI4AI 驱动系统,用于自动代码生成与 Pipeline 优化;

  • 研究演示平台:高校与实验室可用于 AI 代理、记忆机制、探索策略教学;

  • 工业自动调优:节约人工成本,同时提升系统稳定性。


优势与改进方向

维度优势需改进方向
效率与质量并行探索 + 猜测记忆机制 实现高奖牌率推理计算成本仍较高
自主演进闭环机制令系统迭代能力持续增强长期实验中记忆冗余问题
开源生态项目积极推进代码与文档更新尚无 GUI 工具或可视化界面
部署复杂度支持多机并行对硬件环境与依赖配置敏感

// 02 核心 功能

  • 核心定位ML‑Master 是上海交通大学人工智能学院提出的 AI‑for‑AI 智能体,创新融合探索与推理,通过自适应记忆机制在 OpenAI MLE‑Bench 上取得 29.3% 奖牌率,性能全流程领先,适合 AI 工具使用者构建自主进化 AI 系统。
  • 分类索引当前归档在 AI Agent / 智能体,方便和同频工具横向比较。
  • 能力标签关联标签包括 tech-agent、AI Agent。
  • 使用入口已记录可访问入口,可通过本页主按钮跳转。

// 03 使用 场景

  • 快速判断是否适合当前任务结合 AI Agent / 智能体 定位和 tech-agent、AI Agent 标签,先判断它是否匹配你的工作流。
  • 横向比较同类工具从相同分类和标签继续探索替代工具,减少只看单个产品带来的选择偏差。
  • 沉淀工具选型资料把官网入口、平台、版本和 NavXD 标签合并成一页,适合做选型记录或团队分享。

// 04 常见 问题

ML‑Master 是什么?
ML‑Master 是上海交通大学人工智能学院提出的 AI‑for‑AI 智能体,创新融合探索与推理,通过自适应记忆机制在 OpenAI MLE‑Bench 上取得 29.3% 奖牌率,性能全流程领先,适合 AI 工具使用者构建自主进化 AI 系统。
ML‑Master 适合哪些场景?
可优先参考它所属的 AI Agent / 智能体 分类,以及 tech-agent、AI Agent 等标签。
ML‑Master 是否提供可用入口?
本页已记录官网或下载入口,可通过顶部主按钮访问。
ML‑Master 支持哪些平台?
当前记录为网页工具,通常可通过浏览器访问。

// 05 资料 来源

同频段 更多信号

查看 AI Agent / 智能体 全部