首页 / AI工具 / VoiceCraft – 开源的语音编辑和文本转语音模型

AI工具

VoiceCraft – 开源的语音编辑和文本转语音模型

baidu09_com 2025-08-31 11 0

VoiceCraft是一个由德克萨斯大学奥斯汀分校研究团队开源的神经编解码器语言模型，专注于零样本语音编辑和文本到语音（TTS）任务。该模型采用Transformer架构，通过创新的token重排过程，结合因果掩蔽和延迟叠加技术，可零样本实现在现有音频序列内的高效生成。VoiceCraft在多种口音、风格和噪声条件下的语音编辑和TTS任务上展现出卓越性能，生成的语音自然甚至难以与原声区分。

VoiceCraft – 开源的语音编辑和文本转语音模型第1张

（图片来源网络，侵删）

VoiceCraft – 开源的语音编辑和文本转语音模型第2张

（图片来源网络，侵删）

开源语音软件开源语音聊天语音通话开源语音开源框架语音开发开源语音聊天软件语音开发者平台

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://baidu09.com/news/15127.html

上一篇

国五实施提前国六再严30% 排放升级进入快进模式

下一篇

澳德巴克斯机油怎么样

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

登录关灯投稿生成海报返回顶部