Qwen3-Omni-Flash #001
Qwen3-Omni-Flash 是阿里巴巴 Qwen 团队于 2025 年 12 月 1 日发布的下一代原生全模态(omni-modal)大模型,支持文本、图像、音频和视频等多种输入,并能实时流式输出文本与自然语音,...
Qwen‑TTS #002
Qwen-TTS 是阿里云通义千问系列的高保真中英文语音合成模型,支持标准普通话、三种中文方言(北京话、上海话、四川话)及七种中英双语音色,通过流式输出实现快速、高质量语音生成。
Stream‑Omni #003
Stream‑Omni 是由中科院 ICT NLP 团队开源的一体化 GPT‑4o 风格语言-视觉-语音多模态聊天模型。支持任何输入组合(文本、图像、语音)并生成文本和语音回应,具备边听边列文字中转、轻量训练与同声互动...

Janus #004
一款面向开发者和企业的 AI 智能评测平台,通过自动化模拟对话、合规检测与工具调用测试,帮助团队在正式上线前识别潜在问题,提升 AI 代理品质与可靠性。
TEN VAD #005
一款面向企业级应用的实时语音活动检测系统,能够提供精准的帧级语音活动检测。
Fish Audio #006
一款先进的在线 AI 语音合成与声音克隆平台,支持多语言文本转语音(TTS)和个性化声音定制。
CoGenAV #007
一种多模态语音表征模型,旨在通过对比-生成同步策略,学习音频与视觉之间的深层次关联。
Ming-lite-omni #008
蚂蚁集团于 2025 年 5 月开源发布的统一多模态大模型,旨在实现文本、图像、音频和视频等多种模态的理解与生成能力。
Unmute #009
法国 AI 实验室 Kyutai 推出的一款高度模块化的语音 AI 系统,旨在为文本大语言模型(LLM)赋予实时语音交互能力。
Gemma 3n #010
Google 于 2025 年 5 月推出的最新轻量级开源多模态 AI 模型,专为在手机、平板、笔记本等本地设备上高效运行而设计。
Convoso #011
为企业提供云端基础的联系中心软件解决方案。
Reecho睿声 #012
一款领先的AI语音平台,专注于超拟真语音合成和瞬时语音克隆技术。
蚂蚁财富 #013
蚂蚁财富是蚂蚁集团(Ant Group)旗下的智能财富管理平台,依托人工智能(AI)、大数据分析和云计算,为用户提供智能化、个性化的理财服务。

Luzia #014
轻松访问 AI 功能,无需注册,完全免费。Luzia(Soy Luzia)能够帮助你在日常生活中完成各种任务,无论是工作、学习、社交还是追求激情。
