xbench 如何收费？

xbench 的定价模式为：unknown。

当前浏览中

频道最近收录AI

浏览量200

▸ 最近收录AI · 应用工具

xbench 应用工具

红杉中国于 2025 年 5 月 26 日正式发布的一款全新的 AI 基准测试工具，旨在通过科学、长效的评测体系，真实反映 AI 系统在理论能力与实际应用中的表现。

可用性

入口可访问

已记录官网或下载入口

信息核实

已验证

3 条来源，含 NavXD 收录

类型

网页工具

Web · en

收录 2025年5月26日更新 2025年5月26日浏览 200

xbench创新性地将评测任务分为两条互补的主线：

这种双轨评估体系旨在同时追踪模型的理论能力上限与 Agent 的实际落地价值。

为了应对 AI 模型快速演进带来的挑战，xbench采用长青评估机制，通过持续维护并动态更新测试内容，以确保评估的时效性和相关性。这一机制有助于捕捉 Agent 产品迭代过程中的关键突破，进而预测下一个 Agent 应用的技术-市场契合点（TMF，Tech-Market Fit）。

xbench构建了多维度测评数据集，首期发布包含两个核心评估集：

此外，xbench还提出了垂直领域智能体的评测方法论，并构建了面向招聘（Recruitment）和营销（Marketing）领域的垂类 Agent 评测框架。

xbench的推出，不仅为 AI 智能体的评估建立了新标准，也为行业提供了一套可持续发展的评估工具，以应对未来 AI 技术的不断演进。通过科学、长效的评测体系，xbench 有助于推动 AI 技术突破与产品迭代，提升 AI 系统在真实场景中的效用价值。

xbench的发布标志着红杉中国在 AI Agent 赛道完成了从投资人到技术权威的定位转型，体现出其在 AI 领域的宏大产业愿景。作为全球首家由投资机构定义的 AI 基准测试工具，xbench 将为 AI 社区提供一个开放、透明、可持续的评估平台，推动 AI 技术的健康发展。

核心定位红杉中国于 2025 年 5 月 26 日正式发布的一款全新的 AI 基准测试工具，旨在通过科学、长效的评测体系，真实反映 AI 系统在理论能力与实际应用中的表现。
分类索引当前归档在最近收录AI，方便和同频工具横向比较。
能力标签标签信息还在补全中，后续会继续增强能力维度。
使用入口已记录可访问入口，可通过本页主按钮跳转。