CURRENTVIEWING
CH最近收录AI
VIEWS5
▸ 最近收录AI · SITES

Mano-P 1.0 SITES

通过“看屏幕”的方式理解 GUI 界面,并执行点击、输入、切换窗口等操作,从而实现跨软件、跨系统的通用自动化能力。

可用性
入口可访问
已记录官网或下载入口
信息核实
已验证
3 条来源,含 NavXD 收录
类型
网页工具
Web · en
收录 2026年6月13日更新 2026年6月13日浏览 5

// 01 Mano-P 1.0 是什么

项目来源

Mano-P 1.0 是由明略科技(Mininglamp AI)主导开源的 GUI-VLA(图形界面视觉-语言-动作)智能体模型,并联合多所高校与研究团队共同完成。该项目以 Apache 2.0 协议发布,同时提供 GitHub 代码库与模型权重,面向开发者与研究者开放。

从背景来看,这类工作属于“计算机使用智能体(Computer Use Agent)”方向,核心目标是让 AI 能直接像人一样操作电脑界面,而不依赖传统 API 或自动化脚本接口。

它解决的问题

在传统自动化系统中(如 RPA 或网页脚本),AI 通常需要依赖 HTML 结构、接口协议或预定义规则,一旦界面变化或软件不开放 API,就会失效。

Mano-P 的目标是打破这种限制,让模型直接通过“看屏幕”的方式理解 GUI 界面,并执行点击、输入、切换窗口等操作,从而实现跨软件、跨系统的通用自动化能力。

它重点面向复杂桌面软件操作、跨应用流程自动化以及无需 API 的系统级任务执行场景。

核心能力

根据官方技术说明,Mano-P 是一个纯视觉驱动的 GUI-VLA 模型,具备完整的“感知—规划—执行—验证”闭环能力:

  • 纯视觉 GUI 理解:通过屏幕像素直接识别界面元素,无需依赖 HTML 或接口
  • 跨应用操作能力:支持桌面软件、网页应用及复杂工具链的统一操控
  • 多模态模型结构:融合视觉输入与语言指令,输出具体操作动作
  • 端侧部署能力:支持在 Apple M4 等设备上运行轻量量化版本

在公开评测中,该模型在 OSWorld 等 GUI Agent 基准任务上取得了领先成绩,并在多项多模态评测中达到 SOTA 水平,展示了较强的跨任务泛化能力。

如何使用

从开源结构来看,Mano-P 主要通过 GitHub 与模型仓库使用,整体流程偏工程与研究导向:

  1. 从 GitHub 拉取项目代码并配置运行环境
  2. 下载对应模型权重(72B 或 4B 量化版本)
  3. 准备输入任务(屏幕截图或GUI环境 + 自然语言指令)
  4. 运行推理流程,模型生成具体操作动作序列

同时该项目支持以 Skill 形式接入其他 Agent 框架,用作“GUI 执行引擎”,扩展现有 AI 系统的操作能力。

典型使用场景

  • 跨软件办公自动化:在 Excel、邮件、ERP 等系统之间自动处理数据流
  • 软件测试自动化:模拟真实用户点击与操作,完成 UI 测试流程
  • 本地隐私任务处理:在本地环境执行敏感数据操作,避免上传云端

与同类方案的差异

相比传统 RPA 或基于 API 的自动化工具,Mano-P 最大差异在于“纯视觉驱动”。它不依赖 DOM、接口或脚本,而是像人类一样通过视觉理解界面。

相比云端 Agent,它还提供端侧部署能力,使数据可以完全在本地运行,适用于对隐私要求较高的场景。

价格与使用成本

Mano-P 以开源形式发布,本身不涉及商业定价。但实际使用成本主要来自算力需求,例如高参数模型需要 GPU 或 Apple M 系列高性能设备支持。

优势与局限

Mano-P 的优势在于具备较强的 GUI 通用操作能力,并首次在开源体系中较系统地实现了端侧 GUI-VLA 模型架构,使 AI 能直接操作复杂桌面环境。

但其局限也比较明显:部署门槛较高,依赖较强硬件环境,同时在稳定性与长任务可靠性方面仍更偏研究阶段,而非成熟产品。

整体来看,Mano-P 更适合用于 GUI Agent 与自动化方向的技术研究或工程探索,而不是普通用户直接使用的工具型产品。

// 04 常见 问题

Mano-P 1.0 是什么?
通过“看屏幕”的方式理解 GUI 界面,并执行点击、输入、切换窗口等操作,从而实现跨软件、跨系统的通用自动化能力。
Mano-P 1.0 适合哪些场景?
可优先参考它所属的 最近收录AI 分类,以及 GUI Agent 等标签。
Mano-P 1.0 是否提供可用入口?
本页已记录官网或下载入口,可通过顶部主按钮访问。
Mano-P 1.0 支持哪些平台?
当前记录为网页工具,通常可通过浏览器访问。

// 05 资料 来源

搭档工具 // workflow0 条
◇ ◇ ◇
"关系待挖掘"
暂无搭档工具数据
▸ 我来推荐

同频段 更多信号

查看 最近收录AI 全部