SongGeneration 由谁开发？

SongGeneration 由 tencent-ailab 开发。

SongGeneration 如何收费？

SongGeneration 的定价模式为：unknown。

在 NavXD 上如何查找类似工具？

可以通过本页的分类、标签和相关推荐继续浏览同类 AI 工具，也可以返回 AI 工具导航首页按场景筛选更多替代方案。

AI 工具雷达// NavXD.v2LIVE

CURRENTVIEWING

CHAI 大模型 / 对话

▸ AI 大模型 / 对话 · SITES

SongGeneration SITES

SongGeneration 是腾讯AILab开发的开源歌曲生成模型，基于 LeVo 架构与音乐编码器，可从歌词、风格描述与参考音频中并行生成和谐的“人声+伴奏”歌曲，支持中文与英文，适合 AI 工具使用者快速落地音乐创作。

可用性

入口可访问

已记录官网或下载入口

信息核实

已验证

3 条来源，含 NavXD 收录

类型

网页工具

Web · en

访问官网收藏 0

收录 2025年6月21日更新 2025年6月21日浏览 503

// 01 SongGeneration 是什么

在 AI 音乐生成领域，SongGeneration是腾讯AILab 推出的一款高质量开源模型，它采用创新的 LeVo 架构与音乐编码器，支持歌词输入、风格提示与参考音频生成完整歌曲（包括人声与伴奏），并以其开源和多语言支持赢得了开发者关注。

什么是 SongGeneration？

SongGeneration（又名 LeVo）是一个基于语言模型与音乐编解码器的歌曲生成系统，由腾讯AILab 发布在 GitHub 和 Hugging Face 上。它可通过混合或双轨 token 表示，生成高保真歌曲音频，实现“人声 + 伴奏”同步输出，是目前领先的开源文本生成音乐方案之一。

核心技术架构解析

LeVo 架构：混合 + 双轨 token

LeVo 模型同时生成mixed tokens（混合轨）与dual-track tokens（人声和伴奏分离），确保歌词与伴奏同步与和谐。

音乐编码器（Music Codec）

使用 MuCodec 编解码音频：先将双轨 token 编码，再通过解码生成高品质音频，保证输出“可听化”效果 。

多首偏好对齐训练

采用 DPO（动态偏好优化）训练，通过预训练和微调融合多种偏好提升生成质量，使生成歌曲更自然、更契合歌词。

支持输入方式和生成方式

歌词输入：用户可以输入中文或英文歌词，模型会以此为基础生成音乐。
文本描述（可选）：可提供风格、情绪、节奏等提示以指导生成 。
参考音频提示（可选）：输入样本音频片段，生成符合该风格的人声与伴奏。

模型提供 base（歌词驱动）版本，并计划推出支持中英文双语与扩展全模型版本 。

如何获取与使用 SongGeneration

1.教库克隆与依赖安装。

git clone https://github.com/tencent-ailab/SongGeneration pip install -r requirements.txt

2.下载并保存 Hugging Face ckpt 文件（比如 SongGeneration-base v20250520）。

3.执行生成脚本：

sh generate.sh ckpt_path lyrics.jsonl output_path

或使用适合低显存设备的 generate_lowmem.sh。
4.JSONL 输入示例包含 idx, gt_lyric, 可选 descriptions, prompt_audio_path 提示 。

应用场景与潜在价值

音乐创作者与作曲人：快速生成 demo 歌曲，为创作提供灵感助力。
短内容创作者：为视频、广告生成定制配乐或歌曲。
AI 音乐研究与教育：模型架构与公开代码有助于研究人员入门与扩展学习。
唱片创作实验：结合人声与伴奏分离能力，可用于音频编辑与风格对比研究。

// 04 常见问题

SongGeneration 是什么？

SongGeneration 适合哪些场景？

可优先参考它所属的 AI 大模型 / 对话分类，以及 price-open-source、tech-speech、多语言支持、AI音乐生成等标签。

SongGeneration 是否提供可用入口？

本页已记录官网或下载入口，可通过顶部主按钮访问。

SongGeneration 支持哪些平台？

当前记录为网页工具，通常可通过浏览器访问。

// 05 资料来源

NavXD 收...https://navxd.com/navigation/sites/5722.html 官网或下载入口https://github.com/tencent-ailab/SongGeneration 分类与标签体系AI 大模型 / 对话、price-open-source、tech-speech、多语言支持、AI音乐生成

◇ ◇ ◇

"关系待挖掘"
暂无搭档工具数据

▸ 我来推荐

SongGeneration 工具资料卡

NavXD2025年6月21日

GLM-5

GLM-5 是 Zhipu AI（Z.ai）发布的第五代大型语言模型，采用 Mixture-of-Experts 架构与 DeepSeek 稀疏注意力机制，支持高达 20...

AI 大模型 / 对话AI 工具

LingBot-VA

LingBot-VA 是蚂蚁灵波科技（Robbyant / Ant Group）发布的开源具身世界模型。该模型首次提出自回归视频-动作世界建模方法，实现视频动态未来预测与...

AI 大模型 / 对话AI 工具

Voxtral Transcribe 2

Voxtral Transcribe 2 是 Mistral AI 最新发布的第二代语音转写模型系列，包含用于批量转录的 Voxtral Mini Transcribe...

AI 大模型 / 对话AI 工具

Intern-S1-Pro

Intern-S1-Pro 是上海 AI 实验室开源的万亿参数级科学多模态大模型，具备混合专家（MoE）架构与通专融合架构（SAGE），在 AI4Science 科学推理...

AI 大模型 / 对话AI 工具

SongGeneration SITES

// 01 SongGeneration 是什么

什么是 SongGeneration？

核心技术架构解析

LeVo 架构：混合 + 双轨 token

音乐编码器（Music Codec）

多首偏好对齐训练

支持输入方式和生成方式

如何获取与使用 SongGeneration

应用场景与潜在价值

// 04 常见 问题

// 05 资料 来源

// 04 常见问题

// 05 资料来源