Fun-ASR1.5
T-03工具 长尾 OPEN-SOURCE

Fun-ASR1.5

阿里达摩院推出的语音识别模型与工具链版本。

01

Fun-ASR1.5 是什么

Fun-ASR1.5 是阿里达摩院FunASR语音识别体系中的版本更新方向,主要用于实时语音识别、离线转录与语音处理场景。FunASR 提供语音识别、VAD、标点恢复与语音增强等能力,并支持多语言与流式推理。相关项目已在 GitHub 开源,并广泛用于会议转录、字幕生成与语音助手系统。

核心功能

  • 实时语音识别
  • 支持流式转录
  • VAD 与标点恢复
  • 支持多语言
  • 开源工具链

使用场景

  • 会议转录
  • 实时字幕
  • AI 语音助手
  • 语音分析

适合谁用

适合语音 AI 开发者与实时交互团队

常见问题

**Q: Fun-ASR1.5 是什么?**

Fun-ASR1.5 是阿里达摩院 FunASR 语音识别体系的版本方向。

**Q: Fun-ASR1.5 怎么用?**

开发者可通过 GitHub 与 ModelScope 部署语音识别服务。

**Q: Fun-ASR1.5 收费吗?**

项目已开源,可免费使用。

资料来源

  • https://github.com/alibaba-damo-academy/FunASR
  • https://modelscope.cn/
AI大学堂