AI 工具雷达// NavXD.v4实时

当前浏览中

频道AI 音频

浏览量15

▸ AI 音频 · 应用工具

Hojo-ASR-V1 应用工具

快速结论 Hojo-ASR-V1 是 HojoAI 推出的高性能对话语音识别（ASR）模型，采用 Encode […]

可用性

入口可访问

已记录官网或下载入口

信息核实

已验证

3 条来源，含 NavXD 收录

类型

网页工具

Web · 中文/多语言

收录 2026年6月28日更新 2026年6月28日浏览 15

// 01 Hojo-ASR-V1 是什么

Hojo-ASR-V1 界面截图 — Hojo-ASR-V1 · 界面预览

快速结论

Hojo-ASR-V1 是 HojoAI 推出的高性能对话语音识别（ASR）模型，采用 Encoder-Adapter-LLM 框架、以 Qwen3 作为 LLM 解码器，擅长噪声环境、非正式发音、口语纠正和中英文代码混说等复杂真实场景。支持普通话、英语、粤语和四川方言。通过 PyPI 安装 hojo-asr 包、加载模型调用 run_infer() 转录，支持音频路径 / 字节 / scp 输入。Apache 2.0 开源，可学术、个人和商业二次开发，国内可直连（建议配镜像拉 GitHub / HF）。

适合谁优先使用

做语音转写、字幕、语音交互的开发者
需要中英混说 / 方言 / 噪声鲁棒识别的团队
想要可商用开源 ASR 的人
做客服、会议、音视频处理的工程师

核心能力拆解

高性能对话语音识别

Encoder-Adapter-LLM 框架，Qwen3 作解码器。

复杂场景鲁棒

噪声、非正式发音、口语纠正、中英代码混说。

多语言方言

普通话、英语、粤语、四川方言。

易用接口

PyPI 装 hojo-asr，run_infer() 转录，多种输入格式。

和同类工具怎么选

需求	优先考虑	判断标准
可商用开源中英方言 ASR	Hojo-ASR-V1	要自部署、可商用
商用云 ASR	讯飞 / 阿里云	要现成 API
通用开源 ASR	Whisper / FunASR	要成熟生态

国内平替：讯飞、阿里云、腾讯云 ASR；开源有 Whisper、FunASR。

限制与避坑

面向开发者（PyPI / 代码调用），非现成产品
跑模型需环境与算力
方言 / 场景识别准确率以实测为准
Apache 2.0，商用友好

典型工作流

转写一段音频

pip 安装 hojo-asr 包
HOJO_ASR.load_model() 加载模型
run_infer() 传入音频（路径 / 字节 / scp）
得到转录文本

常见问题

Hojo-ASR-V1 是什么？

HojoAI 的高性能对话语音识别模型。

支持哪些语言？

普通话、英语、粤语、四川方言。

免费吗？

Apache 2.0，可商用。

怎么用？

PyPI 安装 hojo-asr，run_infer() 调用。

NavXD 使用建议

如果你要可商用、能扛噪声和中英混说的开源 ASR 自部署，Hojo-ASR-V1 很对路；只要现成 API、不想部署，用讯飞、阿里云这类云 ASR 更省事。

// 02 核心功能

核心定位快速结论 Hojo-ASR-V1 是 HojoAI 推出的高性能对话语音识别（ASR）模型，采用 Encode […]
分类索引当前归档在 AI 音频，方便和同频工具横向比较。
能力标签关联标签包括开源、语音识别、ASR、方言、中英混说。
使用入口已记录可访问入口，可通过本页主按钮跳转。

// 03 使用场景

快速判断是否适合当前任务结合 AI 音频定位和开源、语音识别、ASR 标签，先判断它是否匹配你的工作流。
横向比较同类工具从相同分类和标签继续探索替代工具，减少只看单个产品带来的选择偏差。
沉淀工具选型资料把官网入口、平台、版本和 NavXD 标签合并成一页，适合做选型记录或团队分享。

// 04 常见问题

Hojo-ASR-V1 是什么？

快速结论 Hojo-ASR-V1 是 HojoAI 推出的高性能对话语音识别（ASR）模型，采用 Encode […]

Hojo-ASR-V1 适合哪些场景？

可优先参考它所属的 AI 音频分类，以及开源、语音识别、ASR、方言、中英混说等标签。

Hojo-ASR-V1 是否提供可用入口？

本页已记录官网或下载入口，可通过顶部主按钮访问。

Hojo-ASR-V1 支持哪些平台？

当前记录为网页工具，通常可通过浏览器访问。

// 05 资料来源

NavXD 收...https://navxd.com/navigation/sites/7007.html 官网或下载入口https://github.com/HojoAI/Hojo-ASR 分类与标签体系AI 音频、开源、语音识别、ASR、方言

快速结论 Agent-Reach 是一个开源的「能力层」，给 AI 编程代理（Claude Code、Curs […]

AI Agent / 智能体AI 工具

快速结论 VibeThinker-3B 是微博 AI（WeiboAI）推出的 3B（30 亿参数）推理模型，主 […]

AI 大模型 / 对话AI 工具

快速结论 BrowserBC 是 Einsia 推出的浏览器自动化智能体（Web Agent）方案，核心思路是 […]

AI Agent / 智能体AI 工具

千问输入法

快速结论千问输入法是上海智信普惠科技推出的 AI 输入法，主打「说话秒变工整文字」——语音转文字最快 300 […]

AI 办公AI 工具