// 01 WebSailor 是什么
什么是WebSailor
WebSailor 是 Tongyi Lab(阿里巴巴)在 2025 年 7 月推出的新一代开源 WebAgent。作为 WebAgent 框架 WebWalker、WebDancer 的升级产品,它专注于复杂网页任务的超长推理与主动信息获取,通过强化训练提升模型在真实环境下的不确定性控制与决策能力。
WebSailor 系列模型目前包括 3B、7B、32B 和 72B 参数版本,适配不同规模推理场景,可无缝集成为 AI Agent 工具使用者的浏览与检索能力支持系统。
技术亮点解析
🧠 1. 不确定性驱动抽样(SailorFog‑QA)
WebSailor 首创 SailorFog‑QA 数据管线:通过知识图生成+信息混淆技术构建高难度 QA 任务,迫使 Agent 在极高不确定环境中演化策略。
🔄 2. 双阶段强化训练(RFT + DUPO)
RFT(Rejection Fine‑Tuning)冷启动:使用数千条高质量演示例子建立基础能力;
DUPO(Duplicating Sampling Policy Optimization)强化阶段:高效训练策略生成分支路径,提升探索与决策效率。
🌍 3. 多模型覆盖与章节训练
支持 3B / 7B / 32B / 72B 各种规模模型,后续融合 WebWalker 和 WebDancer 能力,构成统一 WebAgent 系统。
🧪 4. 浏览推理能力 vs 专有系统
在 BrowseComp-en/zh 和 GAIA 等高复杂性 benchmark 上,WebSailor 最高达 12%(en)/30%(zh)成绩,并追平或超越 DeepSeek R1、Grok-3 等闭源系统,仅次于 OpenAI DeepResearch。
WebSailor 系列模型组件
WebSailor‑3B:轻量级 Agent,适合桌面或嵌入式部署;
WebSailor‑7B:中型综合能力优选;
WebSailor‑32B & 72B:高性能 Agent,可应对复杂专一检索任务。
所有模型均开源采用 Apache 2.0 协议,用户可自由下载部署测试 。
使用与部署指南
1. 环境配置(以 WebDancer 为例)
然后下载 WebSailor 模型权重,并执行 demo 启动脚本 。
2. 运行示例
支持 BrowseComp-en/zh 和日常使用任务;
输出包含 Thought→Action→Observation →Answer 循环日志,可视化调试。
3. 自定义训练
修改 SailorFog-QA 样本;
调整 DUPO 强化策略参数;
支持自有 benchmark 数据继续训练。
应用场景与价值
自动研究助手:当作学术 / 行业资料检索与综合工具,无需人工筛选;
复杂客服 & 智能推荐系统:能主动检索计划及回答长链任务;
信息监控系统:如金融、媒体自动监控;设备环境检测等;
增强 Agent 平台底层:可嵌入 Agent 框架,构成百度或自研技能支持模块。
与竞品对比解析
| 项目 | WebSailor (72B) | DeepSeek / Grok‑3 | DeepResearch (OpenAI) |
|---|---|---|---|
| 推理能力 | ✅ 强交互推理、高不确定任务 | ⚠️ 差距明显 | ✅ 超高表现 |
| 开源 | ✅ 全部开源(Apache 2.0) | ❌ 闭源 | ❌ 闭源 |
| 模型规模 | ✅ 多参数版本适配性能需求 | ⚠️ 通常单一模型 | ✅ 大规模 + 专有优化 |
| 推理成本 | ✅ 轻量到大型覆盖广 | ⚠️ 不可控 | ❌ 昂贵服务调用 |
| 部署自由度 | ✅ 本地线程或云端灵活部署 | ❌ 受限供应商服务 | ⚠️ 云端 API 限定 |
用户与社区反馈
AIBase Daily 称赞其“理由与检索能力超群,32B/72B 模型超越 DeepSeek 排名第二,仅落后 DeepResearch”。
DataNorth 评论指出其“不确定环境主动推理能力显著提升,AI Agent 开源竞赛新标杆”。
Medium 专栏称:“WebSailor 是开源 Agent 接近 OpenAI 深度检索能力的里程碑”。
