CURRENTVIEWING
CH最近收录AI
VIEWS532
▸ 最近收录AI · SITES

OAgents SITES

深入解读 OAgents:一款来自领先学术团队的开源基础 Agent 框架,结合模块化组件设计与标准评测体系,助力 AI 工具使用者快速构建高效、多模态、大规模可扩展 Agent 系统。

可用性
入口可访问
已记录官网或下载入口
信息核实
已验证
3 条来源,含 NavXD 收录
类型
网页工具
Web · en
收录 2025年7月9日更新 2025年7月9日浏览 532

// 01 OAgents 是什么

一、什么是 OAgents

OAgents 是由一支多校学术团队提出、并通过 arXiv 论文开源的全新 Agent 构建框架,核心贡献包括:

  • 系统化总结当前多 Agent 设计的关键组件;

  • 提出 GAIA benchmark 和 BrowseComp Evaluation Protocol;

  • 发布开源基础框架,支持模块化组装高效 Agent。

论文名为 “OAgents: An Empirical Study of Building Effective Agents”,于 2025 年 6 月 17 日发布,团队成员来自清华、腾讯优图等多家机构,致力于提高 Agent 研究的可复现性与标准化。


二、研究背景与核心动机

2.1 Agent 研究现状

近年来 Agentic AI 快速发展,但存在严重缺乏标准化评测的问题,导致不同方法难以公平对比,实验复现性差。

2.2 研究目标

  • 构建评价 protocol:在 GAIA benchmark 和 BrowseComp 上实现统一可重复的评测;

  • 分析组件作用:评估不同设计(如 memory、工具链、前端策略)对 Agent 效能影响;

  • 框架设计与开源:OAgents 基于评测结果优化组件设计,并以 MIT 协议开源,提升社区可使用度。


三、OAgents 框架核心组件

3.1 模块化设计

OAgents 支持灵活组合 Agent 核心模块,包括:

  • Planner & Executor:规划和执行推理任务;

  • 工具调用:接入 Web 搜索、API 请求、浏览器自动化等;

  • Memory 管理:长期记忆与短期历史记录;

  • 多 Agent 协作:支持单一或多 Agent 角色协同工作。

研究表明不必要组件如 memory buffer 长度过长,对于某些任务并无显著提升,而过多工具调用则会增加失败风险。

3.2 严格实验协议

OAgents 团队在实验执行中引入随机 seed、20 次重复试验统计,并设计了一套统一工具调用接口,确保结果稳定。


四、GAIA 和 BrowseComp:统一评测体系

4.1 GAIA Benchmark

GAIA 是一个综合性测试集,包含问答、多步搜索、网页交互等任务。OAgents 在 GAIA 衡量下,取得当前开源框架中最佳表现。

4.2 BrowseComp Protocol

该 protocol 重点测评 Agent 的网页导航与信息检索能力,设立阶段性成功/失败标准并量化工具调用次数与有效率。OAgents 使用“最少调用次数达成最大得分”的策略设计,取得领先效果。


五、OAgents 功能亮点详解

5.1 易于扩展与集成

开发者可以通过定义配置文件和 YAML 参数,快速替换模型、插件甚至 Agent 协作策略,适配多种实际应用场景。

5.2 高可复现性

内置 tracing、guardrails、Handoff 机制,支持从实验设计到生产部署实现端到端可追踪和可验证流程。

5.3 多工具链 & 多模型支持

OAgents 支持 OpenAI、Anthropic、Myriad、Claude 等 LLM,也支持 Mistral、本地 LLaMA 等自托管模型,并接入 Selenium、浏览器 API、检索插件等外部工具。


六、适用用户与应用场景

AI 工具使用者

  • 研究人员:构建标准化评测 Agent,提高论文重现率;

  • 开发者:快速搭建对话型、搜索型、浏览型的智能 Agent;

  • 产品经理:可试验不同模块组合,找到最佳交付方案;

  • 教育工作者:可用于教学中展示 Agent 架构设计与工具调用。

实践案例

  • 网页信息自动提取:配置 Agent 阅读产品页面、抓取价格、生成报告;

  • 自动化指标监控:Agent 定时调用搜索 API,监控关键词排名变化;

  • 多 Agent 协同 Chatbot:一个 Agent 负责搜索、另一个负责组织回答并输出摘要。


七、OAgents 与竞品对比

框架架构模块化评测机制强工具调用支持Agent 协作支持
OAgents✅ 高度模块化✅ GAIA/BrowseComp✅ 丰富(浏览、搜索)✅ 内置协作机制
OpenAI Agents SDK🟡 支持部分模块❌ 无统一评测✅ Python 工具❌ 协作缺陷
TaskCraft❌ 单任务设计❌ 非 Agent 多步✅ 工具生成任务❌ 无 Agent 框架
LangChain✅ 强模块化❌ 需自设计评测✅ 插件机制✅ 支持多步骤 Agent

相比竞品,OAgents 的优势在于可评测性强,组件组合更透明易试错。


八、安装与快速上手

8.1 环境依赖

  • Python ≥3.10

  • PyPI 安装:pip install oagents

  • GitHub 克隆:适合开发者扩展

8.2 使用示例

from oagents import OAgent, Runner # 加载默认 agent agent = OAgent.load("default-browser-agent") # 运行浏览网页任务 result = Runner.run(agent, "查找最新 GPT-4o 发布信息,并输出摘要") print(result.summary)

可自由替换模型、工具等组件,配置 YAML 参数实现个性化 Agent。


九、安全性与隐私策略

  • 工具调用控制:内置 guardrails 限制浏览器和搜索工具的使用频率;

  • 敏感信息处理:Agent 执行过程中支持内容屏蔽与隐私脱敏;

  • 开放代码审计:代码开源,安全性透明,便于企业级部署时审核。


// 04 常见 问题

OAgents 是什么?
深入解读 OAgents:一款来自领先学术团队的开源基础 Agent 框架,结合模块化组件设计与标准评测体系,助力 AI 工具使用者快速构建高效、多模态、大规模可扩展 Agent 系统。
OAgents 适合哪些场景?
可优先参考它所属的 最近收录AI 分类,以及 price-open-source、多 Agent 协作 等标签。
OAgents 是否提供可用入口?
本页已记录官网或下载入口,可通过顶部主按钮访问。
OAgents 支持哪些平台?
当前记录为网页工具,通常可通过浏览器访问。

// 05 资料 来源

搭档工具 // workflow0 条
◇ ◇ ◇
"关系待挖掘"
暂无搭档工具数据
▸ 我来推荐

同频段 更多信号

查看 最近收录AI 全部