ML‑Master 如何收费？

ML‑Master 的定价模式为：unknown。

在 NavXD 上如何查找类似工具？

可以通过本页的分类、标签和相关推荐继续浏览同类 AI 工具，也可以返回 AI 工具导航首页按场景筛选更多替代方案。

AI 工具雷达// NavXD.v2LIVE

CURRENTVIEWING

CHAI Agent / 智能体

▸ AI Agent / 智能体 · SITES

ML‑Master SITES

ML‑Master 是上海交通大学人工智能学院提出的 AI‑for‑AI 智能体，创新融合探索与推理，通过自适应记忆机制在 OpenAI MLE‑Bench 上取得 29.3% 奖牌率，性能全流程领先，适合 AI 工具使用者构建自主进化 AI 系统。

可用性

入口可访问

已记录官网或下载入口

信息核实

已验证

3 条来源，含 NavXD 收录

类型

网页工具

Web · en

访问官网收藏 0

收录 2025年7月10日更新 2025年7月10日浏览 651

// 01 ML‑Master 是什么

什么是ML‑Master

ML‑Master 是由上海交通大学人工智能学院 Agents 团队在 2025 年发布的一款 AI‑for‑AI（AI 自主发展）智能体，目标通过“探索–推理”深度结合机制，实现 AI 系统对自身进行持续演进。该系统通过构建自适应记忆，将探索产生的经验纳入推理过程，形成“探索→推理→优化→再探索”的闭环体系。

在 OpenAI MLE‑Bench 基准测试中，ML‑Master 获得 29.3% 的平均奖牌率，显著优于此前的 SOTA 方法，尤其在中等复杂度任务上实现超越，奖牌率达到 20.2%。

背景与目标定位

随着 AI 系统向“自主研发 AI”方向进化，传统 LLM Agent 多为流程驱动，难以充分纳入探索经验，往往导致“试错信息丢失”或推理无法借力历史经验。

上海交大团队提出 ML‑Master，通过平衡探索与推理模块协作，以及自适应记忆机制，实现将历史探索经验系统性注入推理中，并将推理结论反馈探索，实现 AI 自我进化。

核心技术与架构解析

平衡多轨迹探索（Balanced Multi‑Trajectory Exploration）

类似 Monte Carlo Tree Search 构建多路径探索树，同时并行搜索多个可能解决路径；
系统按照潜力与覆盖度为各路径分配资源，防止陷入局部最优。

可控推理（Steerable Reasoning）

深度语言模型（如 DeepSeek‑R1 或其他 LLM）在推理模块中接入自适应记忆，形成条件推理；
模型非盲推理，而是以探索经验为基础构建分析逻辑，从而降低幻觉与误判风险。

自适应记忆机制（Adaptive Memory）

自动收集执行反馈、代码片段、性能指标等探索信息；
结合父节点和兄弟路径重要信息，对记忆进行过滤与精简；
将记忆注入到下次推理中，从而构成动态经验库。

实验评测与性能表现

OpenAI MLE‑Bench 基准测试

平均奖牌率：29.3％，领先如 R&D‑Agent（22.4%）、AIDE（16.9%）等；
中等任务奖牌：20.2%，超过此前 9.0% 的 SOTA 方法两倍以上；
时间成本：仅用 12 小时完成基准测试评估，相比其他方法节约 50% 运行成本。

这些结果体现了 ML‑Master 在效率与质量上的全面领先。

技术创新亮点

1.探索与推理深度融合：非线性分割流程，而是闭环协同，效能提升显著。

2.自适应记忆机制：长期记忆替代单次输入，推理更具历史深度。

3.动态资源分配策略：并行路径探索机制突破效率瓶颈。

4.高效实用性：在有限时间内完成复杂任务，适合工业场景。

架构流程与用户接入建议

克隆项目并安装依赖：github.com/sjtu‑sai‑agents/ML‑Master；
配置环境：预训练模型、推理引擎等；
设置多轨迹探索参数：包括最大路径数、预算限制；
选择推理模型与记忆策略；
运行 MLE‑Bench 或自定义任务；
收集执行结果并构建记忆，可迭代优化。

支持部署于本地服务器或云端，通过项目主页可获取后续评测和工具集。

应用场景与适用用户

自动化 ML 系统研发：替代人工在模型训练、特征工程、调参等环节中的重复劳动；
AI 工具研制：构建 AI4AI 驱动系统，用于自动代码生成与 Pipeline 优化；
研究演示平台：高校与实验室可用于 AI 代理、记忆机制、探索策略教学；
工业自动调优：节约人工成本，同时提升系统稳定性。

优势与改进方向

维度	优势	需改进方向
效率与质量	并行探索 + 猜测记忆机制实现高奖牌率	推理计算成本仍较高
自主演进	闭环机制令系统迭代能力持续增强	长期实验中记忆冗余问题
开源生态	项目积极推进代码与文档更新	尚无 GUI 工具或可视化界面
部署复杂度	支持多机并行	对硬件环境与依赖配置敏感

// 04 常见问题

ML‑Master 是什么？

ML‑Master 适合哪些场景？

可优先参考它所属的 AI Agent / 智能体分类，以及 tech-agent、AI Agent 等标签。

ML‑Master 是否提供可用入口？

本页已记录官网或下载入口，可通过顶部主按钮访问。

ML‑Master 支持哪些平台？

当前记录为网页工具，通常可通过浏览器访问。

// 05 资料来源

NavXD 收...https://navxd.com/navigation/sites/5906.html 官网或下载入口https://sjtu-sai-agents.github.io/ML-Master/分类与标签体系AI Agent / 智能体、tech-agent、AI Agent

◇ ◇ ◇

"关系待挖掘"
暂无搭档工具数据

▸ 我来推荐

ML‑Master 工具资料卡

NavXD2025年7月10日

MemPrivacy

面向 Agent 长期记忆场景的开源隐私保护框架。

最近收录AIAI 工具

腾

腾讯Marvis

腾讯推出的操作系统级 AI 助手，支持本地文件搜索与电脑控制。

最近收录AIAI 工具

SkyBot

SkyBot 是 Skywork 平台推出的 7×24 小时云端 AI 助理，基于 Cloud VM 与即时通讯集成，可主动执行多步骤复杂任务、长期记忆用户偏好，并支持...

AI Agent / 智能体AI 工具

WorkAny Bot

WorkAny Bot 是基于 OpenClaw 框架的云端 AI 智能体，支持 7×24 小时在线运行、接入多种 AI 模型、自定义插件及多渠道交互。它具备长期记忆、任...

AI Agent / 智能体AI 工具

ML‑Master SITES

// 01 ML‑Master 是什么

什么是ML‑Master

背景与目标定位

核心技术与架构解析

平衡多轨迹探索（Balanced Multi‑Trajectory Exploration）

可控推理（Steerable Reasoning）

自适应记忆机制（Adaptive Memory）

实验评测与性能表现

OpenAI MLE‑Bench 基准测试

技术创新亮点

架构流程与用户接入建议

应用场景与适用用户

优势与改进方向

// 04 常见 问题

// 05 资料 来源

// 04 常见问题

// 05 资料来源