AI 工具雷达// NavXD.v2LIVE
TUNEDCH ??
RESULTS14
PAGE1 / 1
FREQUENCY · AI语音助手

AI 语音助手

AI 工具 · AI语音助手 频段,本页汇总 14 个相关工具与入口。

已收录工具
14
本周持平
国内可用
71%
10 / 14
本周新发现
0
扫描中
综合评分
8.4/10
类别平均
◇ FREQUENCY DIAL · UNTUNED
CH 01
scope-non-ai
384
CH 02
tech-cv
364
CH 03
industry-education
198
CH 04
tech-nlp
168
CH 05
price-open-source
135
CH 06
tech-agent
126
CH 07
tech-speech
105
CH 08
industry-medical
93
CH 09
industry-ecommerce
88
CH 10
AI聊天机器人
75
CH 11
type:model
75
CH 12
industry-finance
65
SORT
#001★ 339

Qwen3-Omni-Flash #001

Qwen3-Omni-Flash 是阿里巴巴 Qwen 团队于 2025 年 12 月 1 日发布的下一代原生全模态(omni-modal)大模型,支持文本、图像、音频和视频等多种输入,并能实时流式输出文本与自然语音,...

国内直连VIEW
#002★ 681

Qwen‑TTS #002

Qwen-TTS 是阿里云通义千问系列的高保真中英文语音合成模型,支持标准普通话、三种中文方言(北京话、上海话、四川话)及七种中英双语音色,通过流式输出实现快速、高质量语音生成。

国内直连VIEW
#003★ 531

Stream‑Omni #003

Stream‑Omni 是由中科院 ICT NLP 团队开源的一体化 GPT‑4o 风格语言-视觉-语音多模态聊天模型。支持任何输入组合(文本、图像、语音)并生成文本和语音回应,具备边听边列文字中转、轻量训练与同声互动...

部分可用VIEW
#004★ 312

Janus #004

一款面向开发者和企业的 AI 智能评测平台,通过自动化模拟对话、合规检测与工具调用测试,帮助团队在正式上线前识别潜在问题,提升 AI 代理品质与可靠性。

国内直连VIEW
#005★ 313

TEN VAD #005

一款面向企业级应用的实时语音活动检测系统,能够提供精准的帧级语音活动检测。

部分可用VIEW
#006★ 413

Fish Audio #006

一款先进的在线 AI 语音合成与声音克隆平台,支持多语言文本转语音(TTS)和个性化声音定制。

国内直连VIEW
#007★ 595

CoGenAV #007

一种多模态语音表征模型,旨在通过对比-生成同步策略,学习音频与视觉之间的深层次关联。

部分可用VIEW
#008★ 566

Ming-lite-omni #008

蚂蚁集团于 2025 年 5 月开源发布的统一多模态大模型,旨在实现文本、图像、音频和视频等多种模态的理解与生成能力。

部分可用VIEW
#009★ 589

Unmute #009

法国 AI 实验室 Kyutai 推出的一款高度模块化的语音 AI 系统,旨在为文本大语言模型(LLM)赋予实时语音交互能力。

国内直连VIEW
#010★ 527

Gemma 3n #010

Google 于 2025 年 5 月推出的最新轻量级开源多模态 AI 模型,专为在手机、平板、笔记本等本地设备上高效运行而设计。

国内直连VIEW
#011★ 357

Convoso #011

为企业提供云端基础的联系中心软件解决方案。

国内直连VIEW
#012★ 550

Reecho睿声 #012

一款领先的AI语音平台,专注于超拟真语音合成和瞬时语音克隆技术。

国内直连VIEW
#013★ 709

蚂蚁财富 #013

蚂蚁财富是蚂蚁集团(Ant Group)旗下的智能财富管理平台,依托人工智能(AI)、大数据分析和云计算,为用户提供智能化、个性化的理财服务。

国内直连VIEW
#014★ 657

Luzia #014

轻松访问 AI 功能,无需注册,完全免费。Luzia(Soy Luzia)能够帮助你在日常生活中完成各种任务,无论是工作、学习、社交还是追求激情。

国内直连VIEW