// 01 PhoneBuddy 是什么

快速结论
PhoneBuddy 是一套开源的手机代理(phone-use agent)模型,主打用真实应用与模拟应用结合的强化学习,训练能在真实 Android 设备上执行复杂任务的智能体。它在 AndroidWorld 基准上达 83.2% 成功率,单应用任务约 62%;混合训练比纯真实应用 RL 高 5 个百分点。提供 PhoneBuddy-4B、4B-RealApp、0.8B 多个版本,模型、代码、基准数据集全开源(Hugging Face / GitHub),支持 CLI / GUI / MCP 多种运行方式,国内可直连。
适合谁优先使用
- 做手机自动化、移动端 Agent 的研究者与开发者
- 想要可本地 / 端侧跑的开源手机代理的人
- 研究 GUI agent、强化学习训练的团队
- 关注 MCP / Agent 运行时的工程师
核心能力拆解
真机执行复杂任务
在真实 Android 设备上完成多步任务。
真实 + 模拟混合 RL
比纯真实应用 RL 高 5 个百分点。
多尺寸端侧友好
4B、4B-RealApp、0.8B 可选。
多运行时 + 全开源
CLI / GUI / MCP;模型、代码、基准全开源。
和同类工具怎么选
| 需求 | 优先考虑 | 判断标准 |
|---|---|---|
| 开源可自训的手机代理 | PhoneBuddy | 研究 / 自部署 |
| 通用 GUI agent 研究 | 其它基准 / 框架 | 不限手机场景 |
| 商用手机助手 | 厂商内置智能体 | 开箱即用、非研究 |
国内平替:国产手机厂商有内置智能体;开源手机 agent 研究框架的同类较少。
限制与避坑
- 面向研究 / 开发者,非开箱即用消费产品
- 在真机执行任务需谨慎(权限 / 误操作风险)
- 成功率虽领先但非 100%,复杂任务仍会失败
- 跑模型 / 训练需算力
典型工作流
跑一个手机代理
- 从 Hugging Face 获取 PhoneBuddy 权重(选 4B / 0.8B)
- 从 GitHub 取代码
- 用 CLI / GUI / MCP 接入 Android 设备
- 让 agent 执行手机任务,按 AndroidWorld 式评测
常见问题
PhoneBuddy 是什么?
开源的手机代理模型,能在真实 Android 上执行任务。
免费吗?
模型、代码、基准全开源。
国内能用吗?
可以,Hugging Face / GitHub 均有。
有哪些尺寸?
4B、4B-RealApp、0.8B。
NavXD 使用建议
如果你在做手机自动化或移动端 Agent,PhoneBuddy 是少见的「开源 + 真机 RL」方案,端侧尺寸也友好;但它面向研究、需算力,且真机自动操作有风险,务必在受控环境下先验证。
// 02 核心 功能
- 核心定位快速结论 PhoneBuddy 是一套开源的手机代理(phone-use agent)模型,主打用真实应用与模 […]
- 分类索引当前归档在 AI Agent / 智能体,方便和同频工具横向比较。
- 能力标签关联标签包括 开源、强化学习、GUI Agent、手机代理、端侧模型。
- 使用入口已记录可访问入口,可通过本页主按钮跳转。
// 03 使用 场景
- 快速判断是否适合当前任务结合 AI Agent / 智能体 定位和 开源、强化学习、GUI Agent 标签,先判断它是否匹配你的工作流。
- 横向比较同类工具从相同分类和标签继续探索替代工具,减少只看单个产品带来的选择偏差。
- 沉淀工具选型资料把官网入口、平台、版本和 NavXD 标签合并成一页,适合做选型记录或团队分享。
// 04 常见 问题
PhoneBuddy 是什么?
快速结论 PhoneBuddy 是一套开源的手机代理(phone-use agent)模型,主打用真实应用与模 […]
PhoneBuddy 适合哪些场景?
可优先参考它所属的 AI Agent / 智能体 分类,以及 开源、强化学习、GUI Agent、手机代理、端侧模型 等标签。
PhoneBuddy 是否提供可用入口?
本页已记录官网或下载入口,可通过顶部主按钮访问。
PhoneBuddy 支持哪些平台?
当前记录为网页工具,通常可通过浏览器访问。
