Fun-ASR1.5 由谁开发？

Fun-ASR1.5 由 alibaba-damo-academy 开发。

Fun-ASR1.5 如何收费？

Fun-ASR1.5 的定价模式为：unknown。

AI 工具雷达// NavXD.v4实时

当前浏览中

频道AI 音频

浏览量50

▸ AI 音频 · 应用工具

Fun-ASR1.5 应用工具

阿里达摩院推出的语音识别模型与工具链版本。

可用性

入口可访问

已记录官网或下载入口

信息核实

已验证

3 条来源，含 NavXD 收录

类型

网页工具

Web · 中文/多语言

GitHub收藏 0

收录 2026年5月20日更新 2026年5月20日浏览 50

// 01 Fun-ASR1.5 是什么

Fun-ASR1.5 是阿里达摩院 FunASR 语音识别体系中的版本更新方向，主要用于实时语音识别、离线转录与语音处理场景。FunASR 提供语音识别、VAD、标点恢复与语音增强等能力，并支持多语言与流式推理。相关项目已在 GitHub 开源，并广泛用于会议转录、字幕生成与语音助手系统。

核心功能

实时语音识别
支持流式转录
VAD 与标点恢复
支持多语言
开源工具链

使用场景

会议转录
实时字幕
AI 语音助手
语音分析

适合谁用

适合语音 AI 开发者与实时交互团队

// 02 核心功能

核心定位阿里达摩院推出的语音识别模型与工具链版本。
分类索引当前归档在最近收录AI，方便和同频工具横向比较。
能力标签关联标签包括 type:model、开源、语音识别、ASR、verify:verified。
使用入口已记录可访问入口，可通过本页主按钮跳转。

// 03 使用场景

快速判断是否适合当前任务结合最近收录AI 定位和 type:model、开源、语音识别标签，先判断它是否匹配你的工作流。
横向比较同类工具从相同分类和标签继续探索替代工具，减少只看单个产品带来的选择偏差。
沉淀工具选型资料把官网入口、平台、版本和 NavXD 标签合并成一页，适合做选型记录或团队分享。

// 04 常见问题

Fun-ASR1.5 是什么？

阿里达摩院推出的语音识别模型与工具链版本。

Fun-ASR1.5 适合哪些场景？

可优先参考它所属的最近收录AI 分类，以及 type:model、开源、语音识别、ASR、verify:verified 等标签。

Fun-ASR1.5 是否提供可用入口？

本页已记录官网或下载入口，可通过顶部主按钮访问。

Fun-ASR1.5 支持哪些平台？

当前记录为网页工具，通常可通过浏览器访问。

// 05 资料来源

NavXD 收...https://navxd.com/navigation/sites/6621.html 官网或下载入口https://github.com/alibaba-damo-academy/FunASR 分类与标签体系最近收录AI、type:model、开源、语音识别、ASR

LingBot-VLA 2.0

蚂蚁开源的 VLA（视觉语言动作）基础模型：6 万小时预训练、20 种机器人配置、55 维统一动作，Apache-2.0，魔搭 6B 可下。

AI Agent / 智能体AI 工具

LingBot-Video

蚂蚁开源的首个大规模 MoE 具身视频生成模型：T2I/T2V/TI2V，30B-A3B 提速 3×，7 万小时具身数据，Apache-2.0。

AI 视频AI 工具

Nemotron-Labs-Diffusion

英伟达统一扩散语言模型系列：融合自回归+扩散+自推测解码，3B/8B/14B+VLM，HF 开源，国内需梯子/镜像。

AI 大模型 / 对话AI 工具

悟

悟界·RoboBrain Orca

智源开源的世界模型：以「下一状态预测」学习潜在世界状态，做多模态理解/预测/决策，0.8B–4B，开源。