CURRENTVIEWING
CH最近收录AI
VIEWS9
▸ 最近收录AI · SITES

LongCat-AudioDiT SITES

美团 LongCat 团队推出的扩散式高保真语音生成模型。

可用性
入口可访问
已记录官网或下载入口
信息核实
已验证
3 条来源,含 NavXD 收录
类型
网页工具
Web · 中文/多语言
收录 2026年5月20日更新 2026年5月20日浏览 9

// 01 LongCat-AudioDiT 是什么

LongCat-AudioDiT 是美团 LongCat 团队推出的扩散式文本转语音(TTS)模型,直接在 waveform latent space 中进行建模。官方资料显示,该模型采用非自回归扩散架构,不依赖 mel-spectrogram 等中间声学表示,可实现高保真语音生成与零样本语音克隆。LongCat-AudioDiT 支持长上下文语音生成、多说话人控制与语音风格迁移,并已在 GitHub 开源推理代码与模型。公开 benchmark 显示,其在说话人相似度与自然度方面取得较高表现。

核心功能

  • 扩散式 TTS 架构
  • 支持零样本语音克隆
  • 直接在 waveform latent space 建模
  • 支持长上下文语音生成
  • 开源推理代码

使用场景

  • AI 配音
  • 语音克隆
  • 数字人语音
  • 语音助手
  • 播客生成

适合谁用

适合语音 AI 开发者与数字内容团队

常见问题

**Q: LongCat-AudioDiT 是什么?**

LongCat-AudioDiT 是美团推出的扩散式高保真文本转语音模型。

**Q: LongCat-AudioDiT 怎么用?**

开发者可通过 GitHub 获取模型与推理代码进行部署。

**Q: LongCat-AudioDiT 收费吗?**

项目已开源,可免费使用。

资料来源

  • https://github.com/meituan-longcat/LongCat-AudioDiT
  • https://ai-bio.cn/longcat-audiodit/

// 02 核心 功能

  • 核心定位美团 LongCat 团队推出的扩散式高保真语音生成模型。
  • 分类索引当前归档在 最近收录AI,方便和同频工具横向比较。
  • 能力标签关联标签包括 type:model、AI配音、tts、LongCat、扩散模型、verify:verified。
  • 使用入口已记录可访问入口,可通过本页主按钮跳转。

// 03 使用 场景

  • 快速判断是否适合当前任务结合 最近收录AI 定位和 type:model、AI配音、tts 标签,先判断它是否匹配你的工作流。
  • 横向比较同类工具从相同分类和标签继续探索替代工具,减少只看单个产品带来的选择偏差。
  • 沉淀工具选型资料把官网入口、平台、版本和 NavXD 标签合并成一页,适合做选型记录或团队分享。

// 04 常见 问题

LongCat-AudioDiT 是什么?
美团 LongCat 团队推出的扩散式高保真语音生成模型。
LongCat-AudioDiT 适合哪些场景?
可优先参考它所属的 最近收录AI 分类,以及 type:model、AI配音、tts、LongCat、扩散模型 等标签。
LongCat-AudioDiT 是否提供可用入口?
本页已记录官网或下载入口,可通过顶部主按钮访问。
LongCat-AudioDiT 支持哪些平台?
当前记录为网页工具,通常可通过浏览器访问。

// 05 资料 来源

同频段 更多信号

查看 最近收录AI 全部