VoiceSculptorVoiceSculptor 是一个由 ASLP-lab 开源发布的指令驱动语音合成(Instruct TTS)系统,基于 LLaSA 与 CosyVoice2 支持自然语言描述控制音色、语速、音调、情感等属性,并可用于声音设计与语音合成任务。0410开源工具与社区最近收录AI# AI语音克隆
GLM-TTSGLM-TTS 是一款由 Zhipu AI 开源的工业级 文本转语音(TTS) 系统,支持零样本音色克隆、情感表达控制与流式生成。它采用双阶段架构与多奖励强化学习,可实现高质量自然语音合成,适用于语音助手、有声读物、客服、教育等多种场景。01410内容创作开源工具与社区# AI有声读物# AI语音克隆# 文本转语音(TTS)
Higgs Audio V2Higgs Audio V2 是 Boson AI 发布的开源音频大语言模型,基于 1000 万小时语音数据训练,支持多说话人对话、情感语音、多语言语音生成,适合 AI 工具使用者构建语音 Agent 和音频应用。03610大模型开源工具与社区# AI情感语音合成# AI语音克隆# 音频生成与理解基础模型
11.ai11ai,即 ElevenLabs,由 Piotr Dąbkowski 和 Mati Staniszewski 于 2022 年创办,总部位于纽约,专注于开发高质量语音合成与克隆技术。02730API与SDK最近收录AI# AI播客制作# AI有声书# AI语音克隆
Echovox StudioEchovox Studio 是一款 AI 驱动的全流程音频创作平台,涵盖脚本构思、AI 配音、声音克隆与高级音频编辑,适合播客、视频配音者与内容创作者,高效生成专业音频内容。01550最近收录AI语音识别与生成# AI文本转语音# AI脚本助手# AI语音克隆
OpenAudioFish Audio 推出的新一代文本转语音(TTS)模型,旨在生成高度自然、富有情感的语音输出。01830大模型娱乐媒体# AI播客能容创作# AI有声书内容创作# AI游戏角色语音
KreadoAI集成了数字人头像、语音克隆、文本/图像/PPT 转视频等功能,帮助企业与创作者在分钟级内生成高质量、多语言、可定制的专业视频。03320计算机视觉# AI图片编辑# AI视频创作平台# AI语音克隆