CURRENTVIEWING
CHAI Agent / 智能体
VIEWS567
▸ AI Agent / 智能体 · SITES

DeepSWE SITES

DeepSWE 是由 Agentica 与 Together AI 联合推出的全开源强化学习训练的编程智能体,基于 Qwen3‑32B,专注自研RL算法,达到 59% SWE‑Bench‑Verified,通过端到端代码工具调用,实现复杂软件问题自动修复,非常适合 AI 工具使用者构建高效代码助手。

可用性
入口可访问
已记录官网或下载入口
信息核实
已验证
3 条来源,含 NavXD 收录
类型
网页工具
Web · en
收录 2025年7月11日更新 2025年7月11日浏览 567

// 01 DeepSWE 是什么

一、DeepSWE是什么

DeepSWE-Preview 是一个开放源码的强化学习编程智能体,基于 Qwen3‑32B 并采用 rLLM 框架训练,仅通过 200 步 RL 步骤,便显著提升成绩,在 SWE‑Bench‑Verified 上达 59%,创开源 LLM Agent 之最,Pass@1 达 42.2%

该智能体能理解多文件代码结构,调用 bash、致动编辑器、执行测试等工具,模拟人类软件开发全流程,自动生成、修改并验证代码。


二、研发背景与目标定位

软件工程、LLM 与 RL 的融合

过去基于 GPT 的代码生成依赖SFT,但缺乏交互并验证能力;DeepSWE探索将RL引入,直接在代码环境中通过工具调用与反馈进行训练,提升代理整体解决能力

提升真实开发表现

通过真实环境中的实际工具链训练,DeepSWE能处理更多边界情况、自我检查错误并修复,贴近真实开发者操作模式


三、技术架构与训练机制

RL+Tool 调用架构

基于R2E‑Gym 环境,DeepSWE 使用 bash、搜索、文件编辑及 finish等工具,以交互式方式完成代码修复任务

GRPO++ 算法创新

引入无KL约束、高熵探索、去除方差标准化、length norm、LOO 策略,提升 RL 稳定与长序列任务表现

测试期增强效果

运行16次 rollouts 并使用 verifier LLM 可将准确率提升至 59%,比基础模型高出约 17 点


四、性能表现

  • SWE‑Bench‑Verified:59.0%(Hybrid TTS),42.2% Pass@1

  • 对比竞品:打败OpenHands、Skywork-SWE等多款 32B 开源模型

  • 训练成本:6 天、64 张 H100;200 RL 步骤即可显著提升≧20%


五、部署方式与使用建议

推荐部署:vLLM

建议配合 vLLM(>=0.8.5)使用长上下文支持,本地推理效果良好

API 接入方式

兼容 OpenAI Chat Completion 接口,支持 Hugging Face TGI、TensorRT‑LLM 等推理框架

运行配置建议

温度设为1,max tokens >32K,使用 Agentica 推荐 prompt 和工具集配置,确保最优表现


六、适用场景与用户价值

零代码修复

可在PR中自动定位错误、生成修复代码并验证,节省人力。

多文件工程辅助

DeepSWE擅长大型项目,尤其能处理跨文件依赖、环境配置和测试验证问题。

AI助手嵌入

适合嵌入 IDE、CI/CD、ChatOps 中自动修复或建议代码更改。

研发流水线集成

可作为微服务集成至 DevOps 平台,为企业提供一键补丁能力。


七、优势分析与局限

维度优势局限与挑战
开源透明MIT + 完整 recipes 构建,促进社区扩展与复现RL 超高成本对资源要求高
真实能力效率、准确度超越自回归 SFT 模型,具备交互能力上下文处理仍受限于模型容量
工具兼容支持通用 LLM 接口 + vLLM 等系统,即插即用还不具备多 Agent 协作能力
泛用性可适配多代码库、多语言任务对定制环境/库需二次训练

八、项目生态与社区反馈

  • GitHub Agentica/rLLM 提供完整 RL post-training 框架

  • Together AI 全栈开源:模型、训练脚本、数据集和日志,共建共享

  • 社区热议:Reddit 用户称其“标志着下一代 AI Agent 进入实用阶段”


// 04 常见 问题

DeepSWE 是什么?
DeepSWE 是由 Agentica 与 Together AI 联合推出的全开源强化学习训练的编程智能体,基于 Qwen3‑32B,专注自研RL算法,达到 59% SWE‑Bench‑Verified,通过端到端代码工具调用,实现复杂软件问题自动修复,非常适合 AI 工具使用者构建高效代码助手。
DeepSWE 适合哪些场景?
可优先参考它所属的 AI Agent / 智能体 分类,以及 tech-agent、AI Agent、LLM Agent 等标签。
DeepSWE 是否提供可用入口?
本页已记录官网或下载入口,可通过顶部主按钮访问。
DeepSWE 支持哪些平台?
当前记录为网页工具,通常可通过浏览器访问。

// 05 资料 来源

搭档工具 // workflow0 条
◇ ◇ ◇
"关系待挖掘"
暂无搭档工具数据
▸ 我来推荐

同频段 更多信号

查看 AI Agent / 智能体 全部