// 01 Voice Agent Builder 是什么

快速结论
Voice Agent Builder 是 xAI(Grok 母公司)推出的无代码语音智能体搭建平台,基于 Grok Voice 的"语音到语音"链路,约 2 分钟就能搭出带电话、知识检索、工具、护栏、MCP 与可观测性的生产级语音 Agent。截至 2026-07 处于 beta,按 $0.05/分钟计费(含语音、无平台费),电话号码另加 $0.01/分钟;提供 80+ 内置语音,也可用约 2 分钟音频克隆品牌声音。国内访问 x.ai 需梯子。
适合谁优先使用
- 要快速上线电话客服 / 外呼 / 语音助理的运营与业务团队
- 不想自己拼 STT + 大模型 + TTS 三段栈的开发者
- 需要品牌专属音色(语音克隆)的企业
- 做高并发生产级语音场景、看重时延与自然度的团队
核心能力拆解
无代码搭建
用大白话描述通话流程,再挂上文档 / 工具 / 护栏,约 2 分钟出一个可用 Agent。
一体化能力
电话、知识检索、工具调用、护栏、MCP、可观测性开箱即用。
语音到语音
不是拼三段 API,而是紧耦合 Grok Voice 的 speech-to-speech,时延与语气更自然。
80+ 音色 + 克隆
内置 80 多种语音,或用约 2 分钟音频克隆专属声音。
文档检索
支持上传 txt / Markdown / Word / PPT / Excel / HTML / JSON 等,通话中实时检索。
和同类工具怎么选
| 需求 | 优先考虑 | 判断标准 |
|---|---|---|
| 极速无代码语音 Agent | Voice Agent Builder | 2 分钟出成品、语音到语音 |
| 深度自定义 | 自拼 STT + LLM + TTS | 要极致控制每一环 |
| 国内合规电话场景 | 国内语音厂商 | x.ai 国内直连与合规受限 |
国内平替:国内可看火山引擎 / 阿里云的语音对话方案;跨境电话与合规需自行评估。
限制与避坑
- beta 阶段,功能与价格可能调整(截至 2026-07)。
- x.ai 服务国内直连困难,落地国内电话场景要考虑合规与线路。
- 按分钟计费,高并发长通话成本需提前测算。
NavXD 使用建议
要"最快速度"上线一个能打电话、会查资料、能调工具的语音 Agent,Voice Agent Builder 的无代码 + 语音到语音很有竞争力;国内落地重点解决 x.ai 访问、电话线路与合规。
常见问题
要写代码吗?不用,无代码平台,用自然语言描述通话流程即可。
怎么收费?$0.05/分钟(含语音、无平台费),用它的电话号码再加 $0.01/分钟(截至 2026-07 beta)。
能用自己的声音吗?能,用约 2 分钟音频即可克隆品牌音色,另有 80+ 内置语音。
国内能用吗?x.ai 国内直连困难,需梯子;国内电话落地还要评估合规。

// 02 核心 功能
- 核心定位xAI 无代码语音 Agent 平台,基于 Grok Voice,2 分钟搭出带电话/检索/工具的生产级语音智能体。
- 分类索引当前归档在 AI Agent / 智能体,方便和同频工具横向比较。
- 能力标签关联标签包括 xAI、语音助手、Grok、语音克隆、无代码、语音Agent。
- 使用入口已记录可访问入口,可通过本页主按钮跳转。
// 03 使用 场景
- 快速判断是否适合当前任务结合 AI Agent / 智能体 定位和 xAI、语音助手、Grok 标签,先判断它是否匹配你的工作流。
- 横向比较同类工具从相同分类和标签继续探索替代工具,减少只看单个产品带来的选择偏差。
- 沉淀工具选型资料把官网入口、平台、版本和 NavXD 标签合并成一页,适合做选型记录或团队分享。
