Llasa TTS 是香港科技大学基于 LLaMA 架构推出的开源文本转语音(TTS)模型,支持高质量语音合成和克隆。Llasa TTS 基于单层向量量化(VQ)编解码器和单个 Transformer 架构,与标准 LLaMA 模型完全对齐,生成自然流畅的语音,支持情感表达和等功能。Llasa TTS 在训练和推理阶段均表现出色,基于扩展训练时间和推理时间的计算资源,提升语音的自然度、韵律准确性和情感表达能力。Llasa TTS 提供 1B、3B 和 8B 参数规模的模型,支持多语言合成。

(图片来源网络,侵删)

(图片来源网络,侵删)
全部评论
留言在赶来的路上...
发表评论