Vui 是 Fluxions-AI 团队开源的轻量级语音对话模型,基于 LLaMA 架构。模型经过 4 万小时对话训练,能模拟真实对话中的语气词、笑声和停顿,提供沉浸式交互体验。Vui 提供三种模型,基础模型(通用)、单说话人模型(上下文感知)、双说话人模型(双人互动),适用于语音助手、播客生成、教育培训等场景。模型支持本地部署,能在消费级设备上运行,资源占用低,解决传统语音模型“重、假、难部署”的痛点。

Vui – Fluxions-baidu09AI开源的轻量级语音对话模型  第1张
(图片来源网络,侵删)
Vui – Fluxions-baidu09AI开源的轻量级语音对话模型  第2张
(图片来源网络,侵删)