Gemini TTSGemini TTS 是 Google 最新的文本转语音(Text-to-Speech)技术,通过 Gemini API 或 Google AI Studio 提供高质量、多语言、多角色语音合成服务。支持细粒度风格、语速、情绪与多语音输出控制,并可用于播客、课程、辅助工具与互动应用等场景。0620API与SDK内容创作# AI语音合成# 多语言支持# 文本转语音
Kyutai TTSKyutai TTS 是 Kyutai 团队首个实时流式文本转语音模型,支持英语和法语,具备声线克隆、超低延迟(约220ms)、长音频稳定输出与字级时间戳,可部署本地化、适配 LLM,对 AI 工具使用者极具吸引力。03130大模型开源工具与社区# AI声线克隆# 实时流式文本转语音模型# 文本转语音
11.ai11ai,即 ElevenLabs,由 Piotr Dąbkowski 和 Mati Staniszewski 于 2022 年创办,总部位于纽约,专注于开发高质量语音合成与克隆技术。02740API与SDK最近收录AI# AI播客制作# AI有声书# AI语音克隆
Unmute法国 AI 实验室 Kyutai 推出的一款高度模块化的语音 AI 系统,旨在为文本大语言模型(LLM)赋予实时语音交互能力。04100最近收录AI语音识别与生成# AI客服# AI语音交互# AI语音助手
Fish Audio一个领先的 AI 生成式文本转语音(TTS)和语音克隆平台,基于开源的 Fish Speech 模型。05790最近收录AI语音识别与生成# AI语音克隆平台# AI语音库# Fish Speech 模型
DeepInfraDeepInfra 通过提供无缝、可扩展且经济高效的 AI 推理解决方案,正在改变 AI 景观。其专注于简单性、性能和负担能力,使其成为初创企业和企业的重要选择。04610大模型最近收录AI# AI语音合成# AI语音识别# 大语言模型(LLMS)