AgentCPM-Explore 由谁开发？

AgentCPM-Explore 由 OpenBMB 开发。

AgentCPM-Explore 如何收费？

AgentCPM-Explore 的定价模式为：unknown。

在 NavXD 上如何查找类似工具？

可以通过本页的分类、标签和相关推荐继续浏览同类 AI 工具，也可以返回 AI 工具导航首页按场景筛选更多替代方案。

AI 工具雷达// NavXD.v2LIVE

CURRENTVIEWING

CHAI 大模型 / 对话

▸ AI 大模型 / 对话 · SITES

AgentCPM-Explore SITES

AgentCPM-Explore 是清华大学、人民大学、面壁智能与 OpenBMB 开源社区联合发布的 4B 参数端侧智能体模型，在多项长程智能体基准测试中取得领先表现，支持超 100 轮持续环境交互，并提供配套的开源训练与评测基础设施。

可用性

入口可访问

已记录官网或下载入口

信息核实

已验证

3 条来源，含 NavXD 收录

类型

网页工具

Web · 中文/多语言

访问官网收藏 0

收录 2026年1月17日更新 2026年1月17日浏览 297

// 01 AgentCPM-Explore 是什么

平台总体概述

核心定义

AgentCPM-Explore 是一个 开源端侧智能体基础模型，参数规模约 40 亿（4B），能够在多个长程智能体基准任务中实现稳定的连续环境交互，其中包括 GAIA、HLE、BrowserComp 等评测项目。

发展背景

在智能体研究中，较大参数量模型（如 8B 以上）通常被认为具备长程任务处理能力，而 AgentCPM-Explore 通过紧凑设计与训练优化，在端侧资源限制下实现了同级甚至越级的推理表现，支持超 100 轮交互用于深度探索和策略演化。

开源生态组成

AgentCPM-Explore 的发布包括 全栈开源生态组件，涵盖以下三个主要部分：

AgentDock：工具沙盒统一管理与调度平台，支持多并发工具集成与容错机制。
AgentRL：全异步强化学习训练框架，用于训练与策略优化验证。
AgentToLeaP：一键式评测平台，可在多个智能体基准上自动执行性能评估。

核心能力结构

智能体交互能力

AgentCPM-Explore 支持超过 100 轮稳定环境交互，并通过动态策略调整与多源信息验证机制实现深度探索任务处理，适合长步推理与复杂任务。

此交互能力包括：

多步试探与搜索策略迭代
实时验证环境反馈信息
连续交互保持逻辑连贯性

长程任务评估趋势

在多项主流评测基准（如 GAIA、HLE、BrowserComp、WebWalker、Xbench-DeepResearch、Seal-0 等）中，AgentCPM-Explore 达到或超过同参数规模模型的表现，并在某些任务中表现优于参数更大的模型（如 8B~30B+）。

训练与推理基础

由 OpenBMB 社区发布的全流程训练代码包括：

基于异步强化学习优化路径
对基础模型进行长程任务具体优化
支持端侧推理部署和本地资源集成

上述设计有助于提升模型在资源受限设备上的推理效率。

技术组件详解

AgentDock 平台

AgentDock 是工具沙盒和调度管理平台，通常用于：

高并发工具服务集成
动态任务分发
容器化工具调用与负载均衡
弹性扩缩容与工具热插拔
这些机制通常有助于智能体在端侧长期运行时维持稳定性和性能。

AgentRL 异步强化学习

AgentRL 提供强化学习训练框架，用于优化智能体策略，使其在长期交互环境中能够自适应探索和行为调整。

AgentToLeaP 一键评测

AgentToLeaP 是自动化评测平台，用于在多个智能体测试基准上执行标准评估流程，并输出一致性评估结果。

应用场景

复杂长程任务

AgentCPM-Explore 适用于需要多步探索、逐步推理的复杂任务，例如多阶段决策、模拟策略演化、情境探索模拟等。

智能体开发与评估

作为开源智能体基础模型及框架环境，它可用于智能体算法研究、基准测试体系建设和新策略验证。

端侧推理部署

由于参数规模较小且资源需求较低，AgentCPM-Explore 通常可在具备 GPU 或异构计算能力的终端设备部署，用于离线或本地推理任务。

教育与实验平台

在人工智能教育与实验平台中，该模型可用于教学、探索智能体行为特性、以及教学示例构建。

如何使用

获取模型与代码

访问 GitHub 仓库：https://github.com/OpenBMB/AgentCPM
克隆项目代码并检查 Readme 文档以获取构建和依赖要求。

环境准备

安装 Python 及深度学习框架（如 PyTorch）。
安装项目依赖项并准备本地推理/训练硬件环境。

模型加载与推理

使用项目内提供的推理示例代码加载 4B 参数模型。
根据任务需求设置输入环境和任务定义。
运行交互循环收集模型响应。

训练与策略优化

使用 AgentRL 提供的训练框架配置强化学习任务。
利用 AgentToLeaP 进行评测和验证。
根据反馈调整训练超参数以提高模型表现。

// 04 常见问题

AgentCPM-Explore 是什么？

AgentCPM-Explore 适合哪些场景？

可优先参考它所属的 AI 大模型 / 对话分类，以及 price-open-source、tech-agent、智能体模型等标签。

AgentCPM-Explore 是否提供可用入口？

本页已记录官网或下载入口，可通过顶部主按钮访问。

AgentCPM-Explore 支持哪些平台？

当前记录为网页工具，通常可通过浏览器访问。

// 05 资料来源

NavXD 收...https://navxd.com/navigation/sites/6371.html 官网或下载入口https://github.com/OpenBMB/AgentCPM 分类与标签体系AI 大模型 / 对话、price-open-source、tech-agent、智能体模型

◇ ◇ ◇

"关系待挖掘"
暂无搭档工具数据

▸ 我来推荐

AgentCPM-Explore 工具资料卡

NavXD2026年1月17日

GLM-5

GLM-5 是 Zhipu AI（Z.ai）发布的第五代大型语言模型，采用 Mixture-of-Experts 架构与 DeepSeek 稀疏注意力机制，支持高达 20...

AI 大模型 / 对话AI 工具

SkyBot

SkyBot 是 Skywork 平台推出的 7×24 小时云端 AI 助理，基于 Cloud VM 与即时通讯集成，可主动执行多步骤复杂任务、长期记忆用户偏好，并支持...

AI Agent / 智能体AI 工具

WorkAny Bot

WorkAny Bot 是基于 OpenClaw 框架的云端 AI 智能体，支持 7×24 小时在线运行、接入多种 AI 模型、自定义插件及多渠道交互。它具备长期记忆、任...