OpenAudioFish Audio 推出的新一代文本转语音(TTS)模型,旨在生成高度自然、富有情感的语音输出。01850大模型娱乐媒体# AI播客能容创作# AI有声书内容创作# AI游戏角色语音
OmniAudio阿里巴巴通义实验室开发的空间音频生成模型,能够直接从 360° 视频生成空间音频,为虚拟现实和沉浸式娱乐带来了全新的可能性。02120大模型娱乐媒体# AI增强现实# AI虚拟现实# AI音频内容创作
AiMakeSong一款基于人工智能的在线音乐生成平台,旨在帮助用户通过简单的文本输入或歌词创作,快速生成高质量的原创歌曲。02190娱乐媒体最近收录AI# AI在线音乐生成平台# AI歌词生成工具# 文本转歌曲
Mobvoi MCP Server出门问问(Mobvoi)于 2025 年 5 月 29 日正式发布的一款多模态 AI 服务平台。03960开源工具与社区最近收录AI# AI声音克隆# AI数字人# AI视频翻译
EVI 3一款基于共情大语言模型(eLLM)技术的语音语言模型,能够同时处理文本和语音输入,生成自然、富有表现力的语音响应。03670医疗与健康大模型# AI 语音交互体验# 共情大语言模型(eLLM)# 语音语言模型
AI-Media2Doc一款开源的 AI 图文创作助手,能够将音频和视频内容一键转换为多种风格的文档,如小红书笔记、微信公众号文章、知识笔记、思维导图等。02550开源工具与社区最近收录AI# Ai图文创作助手
Ming-lite-omni蚂蚁集团于 2025 年 5 月开源发布的统一多模态大模型,旨在实现文本、图像、音频和视频等多种模态的理解与生成能力。03810医疗与健康教育与学习# AI内容创作# AI医学影像分析# AI客服
HunyuanVideo-Avatar腾讯混元团队联合腾讯音乐天琴实验室(MuseV)于 2025 年 5 月 28 日发布并开源的语音驱动数字人模型。03290大模型最近收录AI# AI数字人# AI短视频生成工具# AI虚拟主播
Unmute法国 AI 实验室 Kyutai 推出的一款高度模块化的语音 AI 系统,旨在为文本大语言模型(LLM)赋予实时语音交互能力。04100最近收录AI语音识别与生成# AI客服# AI语音交互# AI语音助手
MiniMax一家中国领先的人工智能公司及其核心产品与技术生态,涵盖公司背景、主要产品(包括文本到视频、图像生成、语音合成等)、技术架构、典型应用场景与商业模式。04000大模型最近收录AI# AI Agent# AI聊天机器人# AI艺术生成器
今天学点啥AI“塔子老师”自动拆解、生成幻灯片并配以生动讲解,同时配备互动测验与扩展阅读模块,兼顾趣味性与深度。02,2720教育与学习最近收录AI# AI SVG动画# AI 个性化讲解# AI 动态PPT
阶跃AI融合网页搜索与知识库,支持文本、图像、文档、语音多种输入方式,提供实时对话、多轮交互、图文理解、文档问答及创作辅助等功能,旨在提升个人在工作、学习与生活中的效率与创造力。05670自然语言处理(NLP)计算机视觉# AI个人效率助手# AI代码助手# AI写作
Descript自动化转录、AI 助手、多机位切换等功能融入到同一界面,让创作者在文档式界面中轻松完成剪辑、字幕、配乐和特效处理。04750最近收录AI计算机视觉# AI GIF生成工具# AI助手# AI头像生成工具
Aimi Sync可在短时间内根据视频内容自动生成完整版权清晰的原创音轨,并通过逐帧分析实现多层音频的精准同步。02090最近收录AI语音识别与生成# AI生成音轨# AI音乐生成器# AI音乐视频生成器
Fish Audio一个领先的 AI 生成式文本转语音(TTS)和语音克隆平台,基于开源的 Fish Speech 模型。05790最近收录AI语音识别与生成# AI语音克隆平台# AI语音库# Fish Speech 模型
EapyEapy 是一款由 Pozalabs 开发的 AI 音乐平台,专注于帮助音乐创作者轻松推广作品并提升创作效率。它允许用户上传音乐、图像和文本,生成高质量的在线推广页面,吸引唱片公司、A&R 代表和同步代理的注意。03080语音识别与生成# AI辅助作曲# AI音乐创作平台# AI音乐实时协作