AI音频生成框架

共 1 篇网址

排序

发布更新浏览点赞

ThinkSound

ThinkSound 是一款基于 Chain-of-Thought 推理的多模态音频生成与编辑框架，支持任意模态输入（视频、文本、音频），可交互地为视频生成高质 Foley 声音、定向对象声音细化和自然语言音频编辑，适合 AI 工具使用者打造智能多模态内容流程。

03530

最近收录AI 语音识别与生成 # AI音频生成框架 # 多模态音频生成

AI大学堂