// 01 BrowserAct Skills 是什么

快速结论
BrowserAct Skills(BrowserAct Skills · BrowserAct Team)是一款专为 AI Agent 设计的浏览器自动化 CLI,让 Agent 通过命令行打开、点击、提取网页。MIT 开源,Python 实现,跨 Windows / macOS / Linux,可接入 Claude Code、Cursor、VS Code 等。内置反爬突破、验证码自动处理、多会话并行与隐私隔离。
适合谁优先使用
- 给 AI Agent 加"会上网操作"能力的开发者
- 做网页数据抓取 / 自动化的工程师
- 用 Claude Code / Cursor 想驱动浏览器的人
- 需要多账户隔离批量操作的团队
核心能力拆解
Agent 浏览器操作
CLI 暴露 open / click / state / extract 等命令供 Agent 调用。
反爬突破
环境层 / 执行层 / 人工层三层递进方案。
验证码处理
自动解决验证码。
多会话并行
跨浏览器并行、同浏览器多会话、隐私模式多账户隔离。
Skill Forge
自动生成爬虫 Skill,附 30+ 预置 Solutions 目录。
和同类工具怎么选
| 需求 | 优先考虑 | 判断标准 |
|---|---|---|
| 给 Agent 加浏览器能力 | BrowserAct Skills | 专为 Agent 的 CLI |
| 通用 RPA 录制回放 | 传统 RPA 工具 | 可视化录制 |
| 纯抓取静态页 | requests / 爬虫框架 | 更轻量 |
国内平替:可用 Playwright / Selenium 自建,但 Agent 集成与反爬封装不如它现成。
限制与避坑
- 反爬 / 验证码绕过请遵守目标站条款与法律。
- 免费版功能基础,5+ 隐私浏览器与托管代理需付费。
- 项目较新,生态文档有限。
NavXD 使用建议
当你要让 Claude Code / Cursor 这类 Agent 真正"动手"操作网页、又要应对反爬时,BrowserAct Skills 能直接补上这块能力;合规使用是前提。
常见问题
BrowserAct Skills 免费吗?
MIT 开源,基础功能免费;高级(多隐私浏览器 / 托管代理)付费。
国内能用吗?
能,开源工具本地运行。
支持哪些 Agent?
Claude Code、Cursor、VS Code、OpenCode 等。
// 02 核心 功能
- 核心定位BrowserAct Skills 是面向 AI Agent 的浏览器自动化 CLI,支持反爬、验证码、多会话并行与隐私隔离,可接入 Claude Code/Cursor,MIT 开源。
- 分类索引当前归档在 AI Agent / 智能体,方便和同频工具横向比较。
- 能力标签关联标签包括 AI Agent、开源、浏览器自动化、网页爬虫。
- 使用入口已记录可访问入口,可通过本页主按钮跳转。
// 03 使用 场景
- 快速判断是否适合当前任务结合 AI Agent / 智能体 定位和 AI Agent、开源、浏览器自动化 标签,先判断它是否匹配你的工作流。
- 横向比较同类工具从相同分类和标签继续探索替代工具,减少只看单个产品带来的选择偏差。
- 沉淀工具选型资料把官网入口、平台、版本和 NavXD 标签合并成一页,适合做选型记录或团队分享。
// 04 常见 问题
BrowserAct Skills 是什么?
BrowserAct Skills 是面向 AI Agent 的浏览器自动化 CLI,支持反爬、验证码、多会话并行与隐私隔离,可接入 Claude Code/Cursor,MIT 开源。
BrowserAct Skills 适合哪些场景?
可优先参考它所属的 AI Agent / 智能体 分类,以及 AI Agent、开源、浏览器自动化、网页爬虫 等标签。
BrowserAct Skills 是否提供可用入口?
本页已记录官网或下载入口,可通过顶部主按钮访问。
BrowserAct Skills 支持哪些平台?
当前记录为网页工具,通常可通过浏览器访问。
