AI工具导航
AI工具导航站长导航教师导航服装业导航自媒体导航娱乐业导航
  • AI工具应用集
  • AI博客文章
  • 账号购买
    • 账号合租
  • AI投稿
  • AI排行榜
  • 提示词商城
      • 未登录
        登录后即可体验更多功能
    • AI工具应用集
    • AI博客文章
    • 账号购买
      • 账号合租
    • AI投稿
    • AI排行榜
    • 提示词商城
    未登录
    登录后即可体验更多功能

    语音识别与生成

    共 104 篇网址
    探索前沿的语音识别与生成 AI 工具,涵盖自动语音识别(ASR)、文本转语音(TTS)、语音合成、语音翻译等核心技术。AI工具导航平台汇聚国内外优质的语音 AI 应用与开源项目,助力开发者、企业和研究者高效构建智能语音系统。无论是智能客服、语音助手、无障碍辅助,还是多语言翻译与内容创作,这里都能找到适合的语音识别与生成 AI 解决方案。
    AI商业AI常用工具AI教育AI服装设计AI热门产品AI生活助理SEO优化与推广SEO工具交互设计休闲娱乐兴趣爱好内容创作内容管理与维护写作助手创业者与企业创意设计前端开发办公提效动漫视频医疗健康后端开发国内新闻图片处理图片素材在线办公在线工具在线影视平台在线课程在线购物地区论坛地图导航域名/主机/CDN外语学习大模型娱乐游戏学习学习与教育学术交流学术资源学科领域工具建站/开源系统影视娱乐思维导图提示词教学资源教育技术数据数据分析数据库文学娱乐旅游攻略景点介绍智能对话服务器管理游戏娱乐界面设计社交娱乐社区论坛科技科技资讯绘画平台编程工具编程教程网络监测美食餐饮营销推广虚拟形象行业社区视频制作语言翻译财经财经新闻资源分享音乐播放平台音频合成社交媒体账号合租趣站知识科普大模型 APIAI工具下载应用场景功能类型开发工具平台与服务用户角色技术栈使用难易度支持与资源最近收录AI精选AI集成开发环境(IDE)免费AI工具
    自然语言处理(NLP)计算机视觉语音识别与生成数据分析与预测自动化与机器人智能推荐系统自主智能系统
    排序
    发布更新浏览点赞
    OpenAudio

    OpenAudio

    Fish Audio 推出的新一代文本转语音(TTS)模型,旨在生成高度自然、富有情感的语音输出。
    01850
    大模型娱乐媒体# AI播客能容创作# AI有声书内容创作# AI游戏角色语音
    OmniAudio

    OmniAudio

    阿里巴巴通义实验室开发的空间音频生成模型,能够直接从 360° 视频生成空间音频,为虚拟现实和沉浸式娱乐带来了全新的可能性。
    02120
    大模型娱乐媒体# AI增强现实# AI虚拟现实# AI音频内容创作
    AiMakeSong

    AiMakeSong

    一款基于人工智能的在线音乐生成平台,旨在帮助用户通过简单的文本输入或歌词创作,快速生成高质量的原创歌曲。
    02190
    娱乐媒体最近收录AI# AI在线音乐生成平台# AI歌词生成工具# 文本转歌曲
    TEN VAD

    TEN VAD

    一款面向企业级应用的实时语音活动检测系统,能够提供精准的帧级语音活动检测。
    01820
    最近收录AI语音识别与生成# AI会议记录# AI客服系统# AI语音助手
    Fish Audio

    Fish Audio

    一款先进的在线 AI 语音合成与声音克隆平台,支持多语言文本转语音(TTS)和个性化声音定制。
    02160
    API与SDK最近收录AI# AI声音克隆# AI情感表达# AI游戏开发
    Mobvoi MCP Server

    Mobvoi MCP Server

    出门问问(Mobvoi)于 2025 年 5 月 29 日正式发布的一款多模态 AI 服务平台。
    03960
    开源工具与社区最近收录AI# AI声音克隆# AI数字人# AI视频翻译
    EVI 3

    EVI 3

    一款基于共情大语言模型(eLLM)技术的语音语言模型,能够同时处理文本和语音输入,生成自然、富有表现力的语音响应。
    03680
    医疗与健康大模型# AI 语音交互体验# 共情大语言模型(eLLM)# 语音语言模型
    Chatterbox

    Chatterbox

    Resemble AI 开发并于 2025 年开源发布的高性能文本转语音(TTS)模型。
    03190
    大模型开源工具与社区# AI情感陪伴# AI智能助手# AI语音克隆
    CoGenAV

    CoGenAV

    一种多模态语音表征模型,旨在通过对比-生成同步策略,学习音频与视觉之间的深层次关联。
    04230
    教育与学习最近收录AI# AI视频会议转录# AI语音助手# 多模态语音表征模型
    AI-Media2Doc

    AI-Media2Doc

    一款开源的 AI 图文创作助手,能够将音频和视频内容一键转换为多种风格的文档,如小红书笔记、微信公众号文章、知识笔记、思维导图等。
    02560
    开源工具与社区最近收录AI# Ai图文创作助手
    Ming-lite-omni

    Ming-lite-omni

    蚂蚁集团于 2025 年 5 月开源发布的统一多模态大模型,旨在实现文本、图像、音频和视频等多种模态的理解与生成能力。
    03810
    医疗与健康教育与学习# AI内容创作# AI医学影像分析# AI客服
    HunyuanVideo-Avatar

    HunyuanVideo-Avatar

    腾讯混元团队联合腾讯音乐天琴实验室(MuseV)于 2025 年 5 月 28 日发布并开源的语音驱动数字人模型。
    03300
    大模型最近收录AI# AI数字人# AI短视频生成工具# AI虚拟主播
    Unmute

    Unmute

    法国 AI 实验室 Kyutai 推出的一款高度模块化的语音 AI 系统,旨在为文本大语言模型(LLM)赋予实时语音交互能力。
    04100
    最近收录AI语音识别与生成# AI客服# AI语音交互# AI语音助手
    Lami AI Music Generator

    Lami AI Music Generator

    一款创新的人工智能音乐创作平台,旨在帮助用户通过自然语言描述快速生成原创音乐作品。
    02760
    最近收录AI语音识别与生成# AI音乐创作平台# 文本生成音乐
    Dolphin

    Dolphin

    ByteDance开发的多模态文档图像解析模型,处理包含文本、表格、图形和公式等交织元素的复杂文档图像而设计。
    03110
    大模型开源工具与社区# 多模态处理# 数据提取
    Amie

    Amie

    AI生产力工具,可以整合会议记录、CRM更新、任务规划和日程安排。
    03580
    产品经理与业务分析师数据分析与预测# AI CRM更新# AI任务规划# AI会议记录整合
    ListenHub

    ListenHub

    将任何网页内容快速转化为超现实的AI生成播客,多语言支持包括中文。
    02810
    娱乐媒体教育与学习# AI网页转播客# AI语音技术
    Medeo

    Medeo

    AI在线视频创作与编辑平台。
    06981
    最近收录AI计算机视觉# AI内容创作# AI动画故事# AI视频剪辑
    米壳AI

    米壳AI

    企业级 AI 视频与图像翻译编辑平台。
    03500
    最近收录AI计算机视觉# AI图像翻译# AI声音克隆# AI视频翻译
    AI Music Generator

    AI Music Generator

    基于先进深度学习模型的在线 AI 音乐生成平台。
    03930
    最近收录AI深度学习(DL)# AI文本转曲# AI歌词生成工具# AI音乐生成工具
    音刻(Inkr)

    音刻(Inkr)

    一款专注于高效、多语言、本地化 AI 语音转录与智能笔记工具。
    03830
    最近收录AI语音识别与生成# AI语音转换# 语音转录# 语音转文本
    智启特AI

    智启特AI

    武汉智启特人工智能科技有限公司旗下的一站式 AIGC(人工智能生成内容)行业解决方案平台。
    05550
    娱乐媒体最近收录AI# AI图像生成工具# AI视频生成工具# AI角色建模
    MiniMax

    MiniMax

    一家中国领先的人工智能公司及其核心产品与技术生态,涵盖公司背景、主要产品(包括文本到视频、图像生成、语音合成等)、技术架构、典型应用场景与商业模式。
    04000
    大模型最近收录AI# AI Agent# AI聊天机器人# AI艺术生成器
    Blobfish AI

    Blobfish AI

    通过高度拟人的语音代理,实现大规模自动化拨号、销售线索筛选与呼叫中心角色扮演训练。
    02880
    最近收录AI语音识别与生成# AI呼叫中心培训# AI智能外呼
    FalcoCut

    FalcoCut

    社交媒体多语言AI视频生成工具。
    03490
    最近收录AI计算机视觉# AI广告助手# AI社交媒体助手# AI脚本编写
    免费语音克隆

    免费语音克隆

    一款基于浏览器的 AI 语音克隆工具。
    04110
    最近收录AI语音识别与生成# AI语音克隆工具# 文本转语音# 语音转文本
    AudioX

    AudioX

    将任意文字、图像、视频及已有音频输入转化为专业级音乐、音效和配音。
    04080
    最近收录AI语音识别与生成# AI语音合成# AI音乐增强工具# AI音乐生成工具
    今天学点啥

    今天学点啥

    AI“塔子老师”自动拆解、生成幻灯片并配以生动讲解,同时配备互动测验与扩展阅读模块,兼顾趣味性与深度。
    02,2720
    教育与学习最近收录AI# AI SVG动画# AI 个性化讲解# AI 动态PPT
    Saylo

    Saylo

    预设50万AI角色,进行多模态对话,通过文字、语音和图像等形式共同创作专属剧情。
    01,1610
    语音识别与生成# AI写作助手# AI虚拟现实# AI角色扮演
    Puretalk AI®

    Puretalk AI®

    具备同理心与情感的 AI 对话体验。
    03400
    最近收录AI语音识别与生成# AI聊天机器人# AI语音代理
    阶跃AI

    阶跃AI

    融合网页搜索与知识库,支持文本、图像、文档、语音多种输入方式,提供实时对话、多轮交互、图文理解、文档问答及创作辅助等功能,旨在提升个人在工作、学习与生活中的效率与创造力。
    05670
    自然语言处理(NLP)计算机视觉# AI个人效率助手# AI代码助手# AI写作
    Descript

    Descript

    自动化转录、AI 助手、多机位切换等功能融入到同一界面,让创作者在文档式界面中轻松完成剪辑、字幕、配乐和特效处理。
    04750
    最近收录AI计算机视觉# AI GIF生成工具# AI助手# AI头像生成工具
    Raycast AI

    Raycast AI

    一款为Mac用户设计的高效智能生产力工具。
    03810
    最近收录AI自然语言处理(NLP)# AI内容生成工具# AI搜索# AI语音操控
    AI Video Composer

    AI Video Composer

    AI Video Composer 是一种利用人工智能技术自...
    03110
    计算机视觉语音识别与生成# AI滤镜# AI特效# AI视频剪辑工具
    iRocket iCreaVoice

    iRocket iCreaVoice

    通过实时语音转换技术为用户带来前所未有的互动体验。
    03850
    最近收录AI语音识别与生成# AI语音克隆# AI语音滤镜# AI语音转换工具
    TurboScribe

    TurboScribe

    AI转录工具,专注于将音频和视频文件快速、准确地转换为文本 。
    05620
    商业产品与订阅服务语音识别与生成# AI产品描述生成器# AI语音识别# AI转录工具
    Otter.ai

    Otter.ai

    通过人工智能和机器学习技术提供语音转录和会议生产力工具,帮助用户简化会议流程并提升协作效率。
    05630
    自主智能系统语音识别与生成# AI会议Agent# AI摘要提取# AI笔记助手
    Joi AI

    Joi AI

    用户提供个性化、情感丰富的互动体验。
    03980
    语音识别与生成# AI聊天机器人# AI虚拟伴侣# AI虚拟女友
    Convoso

    Convoso

    为企业提供云端基础的联系中心软件解决方案。
    02080
    最近收录AI自然语言处理(NLP)# AI工作流程管理# AI拨号器# AI聊天机器人
    CreateWise AI

    CreateWise AI

    一款专为播客创作者设计的 Web 端 AI 工具。
    03300
    最近收录AI自然语言处理(NLP)# AI播客# 语音转文字
    Aimi Sync

    Aimi Sync

    可在短时间内根据视频内容自动生成完整版权清晰的原创音轨,并通过逐帧分析实现多层音频的精准同步。
    02100
    最近收录AI语音识别与生成# AI生成音轨# AI音乐生成器# AI音乐视频生成器
    AskManyAI

    AskManyAI

    一款集成了全球顶尖AI模型的多功能协作平台,旨在通过多模型协同机制提升用户的工作效率与决策准确性。
    07690
    教育者与研究人员最近收录AI# AI Agent# AI多功能协作平台
    Reecho睿声

    Reecho睿声

    一款领先的AI语音平台,专注于超拟真语音合成和瞬时语音克隆技术。
    03800
    最近收录AI语音识别与生成# AI语音克隆# AI语音助手# AI语音平台
    Fish Audio

    Fish Audio

    一个领先的 AI 生成式文本转语音(TTS)和语音克隆平台,基于开源的 Fish Speech 模型。
    05790
    最近收录AI语音识别与生成# AI语音克隆平台# AI语音库# Fish Speech 模型
    Traini

    Traini

    过生成式人工智能技术,提升人宠之间的情感交流和行为理解。
    07040
    最近收录AI自然语言处理(NLP)# AI 狗语翻译器# PetGPT# PetGPT 智能助手
    Suno

    Suno

    Suno, Inc.开发的AI音乐创作平台
    04880
    商业产品与订阅服务精选AI# AI文本生成音频# AI音乐创作平台# 多样化音乐风格
    Amazon Nova Sonic

    Amazon Nova Sonic

    亚马逊推出的创新AI语音模型。
    03890
    API与SDK医疗与健康# AI语气识别# AI语音基础模型# 多行业应用
    Noiz AI

    Noiz AI

    语音克隆与合成功能
    04120
    最近收录AI语音识别与生成# AI语音克隆# AI语音合成# 个性化配音
    Eapy

    Eapy

    Eapy 是一款由 Pozalabs 开发的 AI 音乐平台,专注于帮助音乐创作者轻松推广作品并提升创作效率。它允许用户上传音乐、图像和文本,生成高质量的在线推广页面,吸引唱片公司、A&R 代表和同步代理的注意。
    03100
    语音识别与生成# AI辅助作曲# AI音乐创作平台# AI音乐实时协作
    ElevenLabs

    ElevenLabs

    这是一家专注于AI语音合成技术的初创公司,可以创建不同语言、口音和情感的合成语音。
    03570
    语音识别与生成音频合成# AI语音合成# AI语音生成器
    加载更多
    AI大学堂
    AI工具导航
    XD导航,是一个导航分类平台,为广大用户推荐各行业优秀的网址,APP,软件等,更加迎合用户,精细化,职业化,专业化,让不同小众化用户能有更好的用户体验,同时XD导航也是一个浏览器主页,提供了不同主流搜索引擎入口,和官网首页链接入口导航,整理分类了各网址、APP/资源、书籍等,提升效能,一键必达,还有AI技术运用,资讯分享等,欢迎您使用。

    友链申请隐私政策广告合作关于我们免责声明

    扫码加QQ群AI工具导航
    扫码加QQ群
    Copyright © 2026 AI工具导航 滇ICP备2023005905号-3 
    反馈
    让我们一起共建文明社区!您的反馈至关重要!
    网址
    网址文章软件书籍
    热门AI工具搜索
    TraeAI大学堂星辰Agent问小白绘蛙讯飞文书有言AI