Mano-P 1.0 如何收费？

Mano-P 1.0 的定价模式为：unknown。

AI 工具雷达// NavXD.v4实时

当前浏览中

频道AI Agent / 智能体

浏览量199

▸ AI Agent / 智能体 · AI 智能体

Mano-P 1.0 AI 智能体

通过“看屏幕”的方式理解 GUI 界面，并执行点击、输入、切换窗口等操作，从而实现跨软件、跨系统的通用自动化能力。

可用性

入口可访问

已记录官网或下载入口

信息核实

已验证

3 条来源，含 NavXD 收录

类型

网页工具

Web · en

GitHub收藏 0

收录 2026年6月13日更新 2026年6月13日浏览 199

// 01 Mano-P 1.0 是什么

项目来源

Mano-P 1.0 是由明略科技（Mininglamp AI）主导开源的 GUI-VLA（图形界面视觉-语言-动作）智能体模型，并联合多所高校与研究团队共同完成。该项目以 Apache 2.0 协议发布，同时提供 GitHub 代码库与模型权重，面向开发者与研究者开放。

从背景来看，这类工作属于“计算机使用智能体（Computer Use Agent）”方向，核心目标是让 AI 能直接像人一样操作电脑界面，而不依赖传统 API 或自动化脚本接口。

它解决的问题

在传统自动化系统中（如 RPA 或网页脚本），AI 通常需要依赖 HTML 结构、接口协议或预定义规则，一旦界面变化或软件不开放 API，就会失效。

Mano-P 的目标是打破这种限制，让模型直接通过“看屏幕”的方式理解 GUI 界面，并执行点击、输入、切换窗口等操作，从而实现跨软件、跨系统的通用自动化能力。

它重点面向复杂桌面软件操作、跨应用流程自动化以及无需 API 的系统级任务执行场景。

核心能力

根据官方技术说明，Mano-P 是一个纯视觉驱动的 GUI-VLA 模型，具备完整的“感知—规划—执行—验证”闭环能力：

纯视觉 GUI 理解：通过屏幕像素直接识别界面元素，无需依赖 HTML 或接口
跨应用操作能力：支持桌面软件、网页应用及复杂工具链的统一操控
多模态模型结构：融合视觉输入与语言指令，输出具体操作动作
端侧部署能力：支持在 Apple M4 等设备上运行轻量量化版本

在公开评测中，该模型在 OSWorld 等 GUI Agent 基准任务上取得了领先成绩，并在多项多模态评测中达到 SOTA 水平，展示了较强的跨任务泛化能力。

如何使用

从开源结构来看，Mano-P 主要通过 GitHub 与模型仓库使用，整体流程偏工程与研究导向：

从 GitHub 拉取项目代码并配置运行环境
下载对应模型权重（72B 或 4B 量化版本）
准备输入任务（屏幕截图或GUI环境 + 自然语言指令）
运行推理流程，模型生成具体操作动作序列

同时该项目支持以 Skill 形式接入其他 Agent 框架，用作“GUI 执行引擎”，扩展现有 AI 系统的操作能力。

典型使用场景

跨软件办公自动化：在 Excel、邮件、ERP 等系统之间自动处理数据流
软件测试自动化：模拟真实用户点击与操作，完成 UI 测试流程
本地隐私任务处理：在本地环境执行敏感数据操作，避免上传云端

与同类方案的差异

相比传统 RPA 或基于 API 的自动化工具，Mano-P 最大差异在于“纯视觉驱动”。它不依赖 DOM、接口或脚本，而是像人类一样通过视觉理解界面。

相比云端 Agent，它还提供端侧部署能力，使数据可以完全在本地运行，适用于对隐私要求较高的场景。

价格与使用成本

Mano-P 以开源形式发布，本身不涉及商业定价。但实际使用成本主要来自算力需求，例如高参数模型需要 GPU 或 Apple M 系列高性能设备支持。

优势与局限

Mano-P 的优势在于具备较强的 GUI 通用操作能力，并首次在开源体系中较系统地实现了端侧 GUI-VLA 模型架构，使 AI 能直接操作复杂桌面环境。

但其局限也比较明显：部署门槛较高，依赖较强硬件环境，同时在稳定性与长任务可靠性方面仍更偏研究阶段，而非成熟产品。

整体来看，Mano-P 更适合用于 GUI Agent 与自动化方向的技术研究或工程探索，而不是普通用户直接使用的工具型产品。

// 02 核心功能

核心定位通过“看屏幕”的方式理解 GUI 界面，并执行点击、输入、切换窗口等操作，从而实现跨软件、跨系统的通用自动化能力。
分类索引当前归档在最近收录AI，方便和同频工具横向比较。
能力标签关联标签包括 GUI Agent。
使用入口已记录可访问入口，可通过本页主按钮跳转。

// 03 使用场景

快速判断是否适合当前任务结合最近收录AI 定位和 GUI Agent 标签，先判断它是否匹配你的工作流。
横向比较同类工具从相同分类和标签继续探索替代工具，减少只看单个产品带来的选择偏差。
沉淀工具选型资料把官网入口、平台、版本和 NavXD 标签合并成一页，适合做选型记录或团队分享。

// 04 常见问题

Mano-P 1.0 是什么？

通过“看屏幕”的方式理解 GUI 界面，并执行点击、输入、切换窗口等操作，从而实现跨软件、跨系统的通用自动化能力。

Mano-P 1.0 适合哪些场景？

可优先参考它所属的最近收录AI 分类，以及 GUI Agent 等标签。

Mano-P 1.0 是否提供可用入口？

本页已记录官网或下载入口，可通过顶部主按钮访问。

Mano-P 1.0 支持哪些平台？

当前记录为网页工具，通常可通过浏览器访问。

// 05 资料来源

NavXD 收...https://navxd.com/navigation/sites/6642.html 官网或下载入口https://github.com/Mininglamp-AI/Mano-P 分类与标签体系最近收录AI、GUI Agent

Mobile-Agent-v3.5

阿里通义实验室开源的多平台 GUI Agent 框架。

最近收录AIAI 工具

GELab-Zero

GELab-Zero 是由 StepFun AI 团队开源的一款轻量级 GUI Agent — 能本地部署、运行于普通硬件上的 4B GUI 智能体，支持跨 App 界面...