Vui 的定价模式为：unknown。

在 NavXD 上如何查找类似工具？

可以通过本页的分类、标签和相关推荐继续浏览同类 AI 工具，也可以返回 AI 工具导航首页按场景筛选更多替代方案。

AI 工具雷达// NavXD.v2LIVE

CURRENTVIEWING

CHAI 编程

▸ AI 编程 · SITES

Vui SITES

Q: Vui 如何收费？

Vui 的定价模式为：unknown。

Vui——一款轻量级、轻量级语音对话模型（Lightweight Voice Dialogue Model），具备上下文感知与声纹克隆能力的开源 on‑device 模型。

可用性

入口可访问

已记录官网或下载入口

信息核实

已验证

3 条来源，含 NavXD 收录

类型

网页工具

Web · en

访问官网收藏 0

收录 2025年6月11日更新 2025年6月11日浏览 451

// 01 Vui 是什么

一、什么是 Vui？

Vui 是 fluxions‑ai 推出的一款轻量级语音对话模型，能在用户设备本地运行，实现实用的语音交互。Vui 基于 LLaMA Transformer 架构，支持端侧推理，仅需几十 MB 资源即可部署。

模型包含三种版本：

Vui.BASE：基础对话能力，训练于 40,000 小时的对话语料；
Vui.ABRAHAM：单人上下文对话，支持基于历史上下文回复；
Vui.COHOST：支持双人对话轮流交流的协作模型。

全部模型均采用 MIT 许可开源，无需联网即可使用，是面向隐私的轻量端语音 AI 模型典范。

二、为何选择 Vui？

轻量级：相比云端语音服务，Vui 本地运行资源占用极低；
上下文理解：支持接续对话上下文，提升连贯互动体验；
多角色切换：COHOST 适用两人对话场景，实现交互协同；
隐私安全：所有音频处理完全端侧完成，无上传风险；
开源社区活跃：GitHub 已超过 300 星，并持续更新。

此外，来自 LinkedIn 和 Reddit 的反馈指出其以 100M 参数规模与大量训练数据，在 open‑source notebookLM 语音模型中兼具自然度与机器生成质量。

三、如何使用 Vui？

1. 安装与入门

或在 Hugging Face 上启动 Vui.Space 演示。

2. 模型加载与运行

在代码中调用 inference.py，选择所需模型（BASE/ABRAHAM/COHOST），加载上下文后进行语音交互。

3. 支持声纹克隆

Vui 支持基于少量样例语音生成类似声音，适合个性化互动场合。

4. 在设备上运行

适配桌面/低功耗平台，可配合 VAD（语音活动检测）减少冗余处理，仅在用户讲话时激活推理。

四、Vui 的技术原理

基于 LLaMA Transformer，生成音频 token，重建语音回复；
音频 token 解码：将 token 转为 PCM 数据，通过 TTS 模块播报；
本地实时推理：精准控制延迟和隐私；
VAD 支持：使用 silero‑vad 模块检测讲话片段，提升效率；
多说话者训练：COHOST 模型在两人语料上训练，增强协同交互能力；
开源 MIT，便于研究与商用集成发展。

五、典型应用场景

场景	描述
个人助理	安装在 PC/Mac 上语音问答日常事务
智能家居	与手边设备集成，实现免按需求控制
无障碍辅助	为视力不便者提供语音接口
学习机器人	设定角色与情景进行教育对话
实验平台	使用者可在 demo notebook 中探索互动机制
离线部署	适用于隐私要求高的医疗、金融场景

尤其，来自 Reddit 和 LinkedIn 的开发者反馈指出 Vui 可替代商业 notebookLM，验证其低资源条件下处理大规模对话的可行性。

// 04 常见问题

Vui 是什么？

Vui——一款轻量级、轻量级语音对话模型（Lightweight Voice Dialogue Model），具备上下文感知与声纹克隆能力的开源 on‑device 模型。

Vui 适合哪些场景？

可优先参考它所属的 AI 编程分类，以及 price-open-source、tech-speech、AI声音克隆、AI多角色对话等标签。

Vui 是否提供可用入口？

本页已记录官网或下载入口，可通过顶部主按钮访问。

Vui 支持哪些平台？

当前记录为网页工具，通常可通过浏览器访问。

// 05 资料来源

NavXD 收...https://navxd.com/navigation/sites/5548.html 官网或下载入口https://github.com/fluxions-ai/vui 分类与标签体系AI 编程、price-open-source、tech-speech、AI声音克隆、AI多角色对话

◇ ◇ ◇

"关系待挖掘"
暂无搭档工具数据

▸ 我来推荐

Vui 工具资料卡

NavXD2025年6月11日

GLM-5

GLM-5 是 Zhipu AI（Z.ai）发布的第五代大型语言模型，采用 Mixture-of-Experts 架构与 DeepSeek 稀疏注意力机制，支持高达 20...

AI 大模型 / 对话AI 工具

LingBot-VA

LingBot-VA 是蚂蚁灵波科技（Robbyant / Ant Group）发布的开源具身世界模型。该模型首次提出自回归视频-动作世界建模方法，实现视频动态未来预测与...

AI 大模型 / 对话AI 工具

Voxtral Transcribe 2

Voxtral Transcribe 2 是 Mistral AI 最新发布的第二代语音转写模型系列，包含用于批量转录的 Voxtral Mini Transcribe...

AI 大模型 / 对话AI 工具

Intern-S1-Pro

Intern-S1-Pro 是上海 AI 实验室开源的万亿参数级科学多模态大模型，具备混合专家（MoE）架构与通专融合架构（SAGE），在 AI4Science 科学推理...

AI 大模型 / 对话AI 工具

Vui SITES

// 01 Vui 是什么

一、什么是 Vui？

二、为何选择 Vui？

三、如何使用 Vui？

1. 安装与入门

2. 模型加载与运行

3. 支持声纹克隆

4. 在设备上运行

四、Vui 的技术原理

五、典型应用场景

// 04 常见 问题

// 05 资料 来源

// 04 常见问题

// 05 资料来源