DeepSWE 如何收费？

DeepSWE 的定价模式为：unknown。

在 NavXD 上如何查找类似工具？

可以通过本页的分类、标签和相关推荐继续浏览同类 AI 工具，也可以返回 AI 工具导航首页按场景筛选更多替代方案。

AI 工具雷达// NavXD.v2LIVE

CURRENTVIEWING

CHAI Agent / 智能体

▸ AI Agent / 智能体 · SITES

DeepSWE SITES

DeepSWE 是由 Agentica 与 Together AI 联合推出的全开源强化学习训练的编程智能体，基于 Qwen3‑32B，专注自研RL算法，达到 59% SWE‑Bench‑Verified，通过端到端代码工具调用，实现复杂软件问题自动修复，非常适合 AI 工具使用者构建高效代码助手。

可用性

入口可访问

已记录官网或下载入口

信息核实

已验证

3 条来源，含 NavXD 收录

类型

网页工具

Web · en

访问官网收藏 0

收录 2025年7月11日更新 2025年7月11日浏览 567

// 01 DeepSWE 是什么

一、DeepSWE是什么

DeepSWE-Preview 是一个开放源码的强化学习编程智能体，基于 Qwen3‑32B 并采用 rLLM 框架训练，仅通过 200 步 RL 步骤，便显著提升成绩，在 SWE‑Bench‑Verified 上达 59%，创开源 LLM Agent 之最，Pass@1 达 42.2%。

该智能体能理解多文件代码结构，调用 bash、致动编辑器、执行测试等工具，模拟人类软件开发全流程，自动生成、修改并验证代码。

二、研发背景与目标定位

软件工程、LLM 与 RL 的融合

过去基于 GPT 的代码生成依赖SFT，但缺乏交互并验证能力；DeepSWE探索将RL引入，直接在代码环境中通过工具调用与反馈进行训练，提升代理整体解决能力。

提升真实开发表现

通过真实环境中的实际工具链训练，DeepSWE能处理更多边界情况、自我检查错误并修复，贴近真实开发者操作模式。

三、技术架构与训练机制

RL+Tool 调用架构

基于R2E‑Gym 环境，DeepSWE 使用 bash、搜索、文件编辑及 finish等工具，以交互式方式完成代码修复任务。

GRPO++ 算法创新

引入无KL约束、高熵探索、去除方差标准化、length norm、LOO 策略，提升 RL 稳定与长序列任务表现。

测试期增强效果

运行16次 rollouts 并使用 verifier LLM 可将准确率提升至 59%，比基础模型高出约 17 点。

四、性能表现

SWE‑Bench‑Verified：59.0%（Hybrid TTS），42.2% Pass@1。
对比竞品：打败OpenHands、Skywork-SWE等多款 32B 开源模型。
训练成本：6 天、64 张 H100；200 RL 步骤即可显著提升≧20%。

五、部署方式与使用建议

推荐部署：vLLM

建议配合 vLLM（>=0.8.5）使用长上下文支持，本地推理效果良好。

API 接入方式

兼容 OpenAI Chat Completion 接口，支持 Hugging Face TGI、TensorRT‑LLM 等推理框架。

运行配置建议

温度设为1，max tokens >32K，使用 Agentica 推荐 prompt 和工具集配置，确保最优表现。

六、适用场景与用户价值

零代码修复

可在PR中自动定位错误、生成修复代码并验证，节省人力。

多文件工程辅助

DeepSWE擅长大型项目，尤其能处理跨文件依赖、环境配置和测试验证问题。

AI助手嵌入

适合嵌入 IDE、CI/CD、ChatOps 中自动修复或建议代码更改。

研发流水线集成

可作为微服务集成至 DevOps 平台，为企业提供一键补丁能力。

七、优势分析与局限

维度	优势	局限与挑战
开源透明	MIT + 完整 recipes 构建，促进社区扩展与复现	RL 超高成本对资源要求高
真实能力	效率、准确度超越自回归 SFT 模型，具备交互能力	上下文处理仍受限于模型容量
工具兼容	支持通用 LLM 接口 + vLLM 等系统，即插即用	还不具备多 Agent 协作能力
泛用性	可适配多代码库、多语言任务	对定制环境/库需二次训练

八、项目生态与社区反馈

GitHub Agentica/rLLM 提供完整 RL post-training 框架。
Together AI 全栈开源：模型、训练脚本、数据集和日志，共建共享。
社区热议：Reddit 用户称其“标志着下一代 AI Agent 进入实用阶段”。

// 04 常见问题

DeepSWE 是什么？

DeepSWE 适合哪些场景？

可优先参考它所属的 AI Agent / 智能体分类，以及 tech-agent、AI Agent、LLM Agent 等标签。

DeepSWE 是否提供可用入口？

本页已记录官网或下载入口，可通过顶部主按钮访问。

DeepSWE 支持哪些平台？

当前记录为网页工具，通常可通过浏览器访问。

// 05 资料来源

NavXD 收...https://navxd.com/navigation/sites/5924.html 官网或下载入口https://huggingface.co/agentica-org/DeepSWE-Preview 分类与标签体系AI Agent / 智能体、tech-agent、AI Agent、LLM Agent

◇ ◇ ◇

"关系待挖掘"
暂无搭档工具数据

▸ 我来推荐

DeepSWE 工具资料卡

NavXD2025年7月11日

MemPrivacy

面向 Agent 长期记忆场景的开源隐私保护框架。

最近收录AIAI 工具

腾

腾讯Marvis

腾讯推出的操作系统级 AI 助手，支持本地文件搜索与电脑控制。

最近收录AIAI 工具

SkyBot

SkyBot 是 Skywork 平台推出的 7×24 小时云端 AI 助理，基于 Cloud VM 与即时通讯集成，可主动执行多步骤复杂任务、长期记忆用户偏好，并支持...

AI Agent / 智能体AI 工具

WorkAny Bot

WorkAny Bot 是基于 OpenClaw 框架的云端 AI 智能体，支持 7×24 小时在线运行、接入多种 AI 模型、自定义插件及多渠道交互。它具备长期记忆、任...

AI Agent / 智能体AI 工具

DeepSWE SITES

// 01 DeepSWE 是什么

一、DeepSWE是什么

二、研发背景与目标定位

软件工程、LLM 与 RL 的融合

提升真实开发表现

三、技术架构与训练机制

RL+Tool 调用架构

GRPO++ 算法创新

测试期增强效果

四、性能表现

五、部署方式与使用建议

推荐部署：vLLM

API 接入方式

运行配置建议

六、适用场景与用户价值

零代码修复

多文件工程辅助

AI助手嵌入

研发流水线集成

七、优势分析与局限

八、项目生态与社区反馈

// 04 常见 问题

// 05 资料 来源

// 04 常见问题

// 05 资料来源