PlanningBench 如何收费？

PlanningBench 的定价模式为：unknown。

AI 工具雷达// NavXD.v4实时

当前浏览中

频道AI Agent / 智能体

浏览量10

▸ AI Agent / 智能体 · 应用工具

PlanningBench 应用工具

快速结论 PlanningBench 是腾讯混元（Tencent Hunyuan）团队推出的大模型「规划能力」 […]

可用性

入口可访问

已记录官网或下载入口

信息核实

已验证

3 条来源，含 NavXD 收录

类型

网页工具

Web · 中文/多语言

GitHub收藏 0

收录 2026年6月25日更新 2026年6月25日浏览 10

// 01 PlanningBench 是什么

PlanningBench 界面截图 — PlanningBench · 界面预览

快速结论

PlanningBench 是腾讯混元（Tencent Hunyuan）团队推出的大模型「规划能力」评估基准与数据合成框架。它的核心是一条「约束驱动合成管道」，自动生成可扩展、可验证的规划任务，覆盖 30 多种任务类型、子任务、约束族与难度因子，用来诊断开源与闭源大模型在耦合约束下能否给出完整解。论文已发布（arXiv:2605.20873），配套数据集托管在 HuggingFace，代码在 GitHub。

适合谁优先使用

研究大模型规划、推理与约束求解能力的研究者
想用可验证规划数据做强化学习 / 微调的团队
需要诊断自家模型规划短板的厂商

核心能力拆解

约束驱动合成管道

自动生成自包含、可验证的规划问题，规模可扩展，不依赖人工逐题构造。

分层任务体系

覆盖 30 多种任务类型、子任务、约束族和难度因子，系统化考察规划能力。

诊断耦合约束下的完整解

实测发现现有大模型在多重耦合约束下仍难以给出完整解，能定位模型短板。

可用于强化学习

论文验证：在 PlanningBench 数据上做强化学习，能提升模型在未见规划基准和指令遵循任务上的表现——确定或良定义的最优解提供更清晰的奖励信号。

和同类工具怎么选

需求	优先考虑	判断标准
专测规划 / 约束求解	PlanningBench	要可验证、可做 RL 的规划数据
评测 Agent 工具调用组合	PawBench 等	关注框架而非纯规划
通用推理能力	通用推理基准	不局限于规划任务

国内平替：腾讯混元本身为国内团队；规划评测也可参考其它公开基准。

限制与避坑

偏学术 / 研究，主要是数据集 + 论文，不是开箱即用的产品
需自备模型与算力做评测或 RL
论文摘要未列任务总数，具体规模以 GitHub / HuggingFace 仓库为准
商用授权以仓库 License 为准

常见问题

PlanningBench 开源吗？

论文已公开（arXiv:2605.20873），数据集在 HuggingFace、代码在 GitHub，具体可用范围以仓库为准。

国内能用吗？

能。由腾讯混元团队出品，资料和代码可在 GitHub / HuggingFace 获取（国内拉取建议配镜像）。

它能用来干什么？

既能评测模型的规划能力，也能用它生成的可验证数据做强化学习，提升模型规划与指令遵循。

NavXD 使用建议

研究或想提升模型的规划 / 约束求解能力时，PlanningBench 提供了「能自动出题、又能验证对错」的数据来源，比人工造题更可扩展；只做通用对话或评测，不必专门上它。

// 02 核心功能

核心定位快速结论 PlanningBench 是腾讯混元（Tencent Hunyuan）团队推出的大模型「规划能力」 […]
分类索引当前归档在 AI Agent / 智能体，方便和同频工具横向比较。
能力标签关联标签包括腾讯混元、数据集、基准测试、大模型评测、规划能力。
使用入口已记录可访问入口，可通过本页主按钮跳转。

// 03 使用场景

快速判断是否适合当前任务结合 AI Agent / 智能体定位和腾讯混元、数据集、基准测试标签，先判断它是否匹配你的工作流。
横向比较同类工具从相同分类和标签继续探索替代工具，减少只看单个产品带来的选择偏差。
沉淀工具选型资料把官网入口、平台、版本和 NavXD 标签合并成一页，适合做选型记录或团队分享。

// 04 常见问题

PlanningBench 是什么？

快速结论 PlanningBench 是腾讯混元（Tencent Hunyuan）团队推出的大模型「规划能力」 […]

PlanningBench 适合哪些场景？

可优先参考它所属的 AI Agent / 智能体分类，以及腾讯混元、数据集、基准测试、大模型评测、规划能力等标签。

PlanningBench 是否提供可用入口？

本页已记录官网或下载入口，可通过顶部主按钮访问。

PlanningBench 支持哪些平台？

当前记录为网页工具，通常可通过浏览器访问。

// 05 资料来源

NavXD 收...https://navxd.com/navigation/sites/6969.html 官网或下载入口https://github.com/Tencent-Hunyuan/PlanningBench 分类与标签体系AI Agent / 智能体、腾讯混元、数据集、基准测试、大模型评测

HPC-Ops

快速结论 HPC-Ops 是腾讯混元 AI 基础设施团队开源的生产级、高性能 LLM 推理算子库，专注「主导实 […]

AI 编程AI 工具

BigSet

快速结论 BigSet 是 TinyFish 团队推出的开源工具，主打用一句自然语言描述，就让 AI 自动从互 […]

AI Agent / 智能体AI 工具

Kairos-HomeWorld

快速结论 Kairos-HomeWorld 是由 Ace Robotics、香港中文大学 MMLab 与深圳 […]

AI Agent / 智能体AI 工具

PawBench

快速结论 PawBench 是 AgentScope 团队推出的开源 AI Agent 评估基准，主打把「模型 […]

AI Agent / 智能体AI 工具

PlanningBench 应用工具

// 01 PlanningBench 是什么

快速结论

适合谁优先使用

核心能力拆解

约束驱动合成管道

分层任务体系

诊断耦合约束下的完整解

可用于强化学习

和同类工具怎么选

限制与避坑

常见问题

PlanningBench 开源吗？

国内能用吗？

它能用来干什么？

NavXD 使用建议

// 02 核心 功能

// 03 使用 场景

// 04 常见 问题

// 05 资料 来源

// 02 核心功能

// 03 使用场景

// 04 常见问题

// 05 资料来源