PC Agent-E 由谁开发？

PC Agent-E 由 GAIR-NLP 开发。

PC Agent-E 如何收费？

PC Agent-E 的定价模式为：unknown。

AI 工具雷达// NavXD.v4实时

当前浏览中

频道AI Agent / 智能体

浏览量200

▸ AI Agent / 智能体 · AI 智能体

PC Agent-E AI 智能体

上海交通大学与 GAIR 实验室联合开发的高效计算机使用智能体训练框架。

可用性

入口可访问

已记录官网或下载入口

信息核实

已验证

3 条来源，含 NavXD 收录

类型

网页工具

Web · en

访问官网 GitHub收藏 0

收录 2025年5月28日更新 2025年5月28日浏览 200

// 01 PC Agent-E 是什么

PC Agent-E是由上海交通大学与 GAIR 实验室联合开发的高效计算机使用智能体训练框架，旨在通过少量高质量的人类演示数据，训练出具备强大计算机操作能力的 AI 智能体。该项目已在 GitHub 开源，并在多个基准测试中取得了领先的性能表现。

🧠 PC Agent-E 是什么？

PC Agent-E 是一个高效的 AI 训练框架，专为培养具备人类级计算机操作能力的智能体而设计。它通过创新的数据增强方法，利用少量人类演示数据，生成丰富的训练样本，从而显著提升智能体在实际操作中的表现。

🚀 如何使用 PC Agent-E？

获取代码：访问 GitHub 仓库下载项目代码。
安装依赖：根据项目提供的说明，安装所需的依赖环境。
准备数据：使用提供的工具收集或加载人类操作轨迹数据。
训练模型：运行训练脚本，利用增强后的数据训练智能体模型。
评估性能：在提供的基准测试环境中评估模型的操作能力。

🔧 主要功能

高效的数据增强：通过“Trajectory Boost”技术，从少量人类轨迹中生成多样化的训练样本。
思维过程建模：重建人类操作中的思维过程，提升模型的决策能力。
跨平台泛化能力：在不同操作系统上均表现出良好的适应性。
开源资源丰富：提供完整的代码、模型和数据，方便研究和应用。

⚙️ 技术原理

PC Agent-E 的核心在于其四个关键组件：

轨迹收集（Trajectory Collection）：使用 PC Tracker 工具收集人类操作轨迹，包括任务描述、屏幕截图和操作动作。
思维重建（Thought Completion）：利用 Claude 3.7 Sonnet 模型，重建人类在每一步操作中的思维过程。
轨迹增强（Trajectory Boost）：基于现有轨迹，生成多样化的替代操作，构建丰富的训练数据。
智能体训练（Agent Training）：使用增强后的数据，训练具备强大操作能力的智能体模型。

该框架采用 ReAct 范式，结合视觉和语言信息，提升模型的推理和操作能力。

🎯 应用场景

自动化办公：自动完成文档编辑、数据分析等任务，提高办公效率。
软件测试：模拟用户操作，发现软件中的错误和问题，提升软件质量。
教育辅助：作为虚拟助教，帮助学生完成计算机操作任务，提供即时指导。
辅助残障人士：提供辅助操作功能，方便残障人士使用计算机。
跨平台兼容：在不同操作系统之间迁移和执行任务，实现无缝切换。

📂 项目地址

项目官网：https://gair-nlp.github.io/PC-Agent-E/
GitHub 仓库：https://github.com/GAIR-NLP/PC-Agent-E
HuggingFace 模型库：https://huggingface.co/henryhe0123/PC-Agent-E
技术论文：https://arxiv.org/pdf/2505.13909

// 02 核心功能

核心定位上海交通大学与 GAIR 实验室联合开发的高效计算机使用智能体训练框架。
分类索引当前归档在 AI Agent / 智能体，方便和同频工具横向比较。
能力标签关联标签包括 price-open-source、tech-agent、多模态智能体。
使用入口已记录可访问入口，可通过本页主按钮跳转。

// 03 使用场景

快速判断是否适合当前任务结合 AI Agent / 智能体定位和 price-open-source、tech-agent、多模态智能体标签，先判断它是否匹配你的工作流。
横向比较同类工具从相同分类和标签继续探索替代工具，减少只看单个产品带来的选择偏差。
沉淀工具选型资料把官网入口、平台、版本和 NavXD 标签合并成一页，适合做选型记录或团队分享。

// 04 常见问题

PC Agent-E 是什么？

上海交通大学与 GAIR 实验室联合开发的高效计算机使用智能体训练框架。

PC Agent-E 适合哪些场景？

可优先参考它所属的 AI Agent / 智能体分类，以及 price-open-source、tech-agent、多模态智能体等标签。

PC Agent-E 是否提供可用入口？

本页已记录官网或下载入口，可通过顶部主按钮访问。

PC Agent-E 支持哪些平台？

当前记录为网页工具，通常可通过浏览器访问。

// 05 资料来源

NavXD 收...https://navxd.com/navigation/sites/5324.html 官网或下载入口https://gair-nlp.github.io/PC-Agent-E/分类与标签体系AI Agent / 智能体、price-open-source、tech-agent、多模态智能体

GLM-5

GLM-5 是 Zhipu AI（Z.ai）发布的第五代大型语言模型，采用 Mixture-of-Experts 架构与 DeepSeek 稀疏注意力机制，支持高达 20...

AI 大模型 / 对话AI 工具

SkyBot

SkyBot 是 Skywork 平台推出的 7×24 小时云端 AI 助理，基于 Cloud VM 与即时通讯集成，可主动执行多步骤复杂任务、长期记忆用户偏好，并支持...

AI Agent / 智能体AI 工具

WorkAny Bot

WorkAny Bot 是基于 OpenClaw 框架的云端 AI 智能体，支持 7×24 小时在线运行、接入多种 AI 模型、自定义插件及多渠道交互。它具备长期记忆、任...