Seeduplex
项目来源
Seeduplex 是字节跳动 Seed 团队推出的原生全双工语音大模型,并已集成到豆包 App 中进行规模化应用。
该项目属于字节在“语音大模型 + AI Agent 交互能力”方向的重要升级,目标是突破传统语音助手的“轮流对话”模式,让 AI 能够像真人一样边听边说。
根据官方技术说明与发布信息,该能力于 2026 年左右在豆包 App 全量上线,面向普通用户开放语音通话式交互体验。
它解决的问题
传统语音助手(如早期 Siri 或多数 AI 语音产品)普遍采用“半双工”模式,即必须用户说完后 AI 才能回应,这会导致明显的等待感、打断问题以及交流不自然。
Seeduplex 的目标是让语音交互更接近真实人类对话:可以插话、可以打断、可以边说边理解,同时在复杂环境中仍保持稳定识别能力。
它主要面向实时语音助手、AI 电话助手、车载语音交互以及移动端 AI Agent 等高频交互场景。
核心能力
从公开资料来看,Seeduplex 的核心能力围绕“全双工语音交互”展开,即输入与输出同时进行,而不是轮流进行。
- 边听边说能力:AI 可以在用户未说完时同步理解语义并生成回应
- 精准抗干扰:在噪音、多人语音环境中识别主用户指令,减少误识别
- 动态判停机制:判断用户是停顿思考还是已完成表达,减少抢话或打断
- 低延迟响应:对话延迟压缩到约数百毫秒级别,提升实时感
相关评测显示,其在打断控制、抢话比例与对话流畅度等指标上相较传统半双工模型有明显提升。
如何使用
Seeduplex 已集成在豆包 App 中,用户无需单独下载模型或配置复杂环境。
- 更新豆包 App 至最新版本
- 进入语音通话或语音助手入口
- 选择支持 Seeduplex 的语音模式(部分音色或功能入口)
- 直接使用自然语言与 AI 进行语音对话
目前未公开提供独立 API 或开发者接口,主要以产品内体验为主。
典型使用场景
- 实时语音聊天:像打电话一样与 AI 连续对话,无需等待轮次
- 复杂环境语音助手:在车内、咖啡厅等噪音场景中稳定识别用户指令
- 快速问答与信息获取:边说边补充问题,AI 可实时调整回答方向
与同类技术的差异
与传统语音助手相比,Seeduplex 的最大变化在于交互范式,从“对讲机式轮流对话”升级为“连续流式对话”。
相比大多数仍依赖半双工架构的语音系统,它能够同时处理语音输入与输出,减少等待时间和打断感。
同时,它在复杂声学环境中的抗干扰能力更强,更适合真实世界而非理想安静环境。
价格与使用成本
Seeduplex 目前作为豆包 App 内部能力开放,用户端体验通常是免费的,但未独立开放商业定价或 API 计费模型。
优势与局限
Seeduplex 的优势在于显著提升语音交互自然度,使 AI 从“工具式问答”更接近“实时对话伙伴”,同时在复杂环境适应性方面有明显增强。
但目前它仍然是产品级能力而非开放平台能力,缺乏开发者接口,且部分高级能力依赖豆包生态内实现,扩展性有限。
总体来看,Seeduplex 更像是下一代语音交互范式的产品级落地,而不是独立开发工具,更适合体验型用户与语音 AI 技术观察者关注。






