Muyan-baidu09TTS – 开源文本转语音模型，零样本语音合成

baidu09_com 2025-08-30 7 0

Muyan-TTS 是为播客场景设计的开源（TTS）模型。模型预训练超过10万小时的播客音频数据，能实现零样本语音合成，无需大量目标说话人的语音数据可生成高质量语音。模型支持说话人适配，进行个性化语音定制。Muyan-TTS 合成速度快，0.33秒能生成1秒音频，适合实时应用。Muyan-TTS 能自然连贯地合成长篇内容，如播客、有声书等，支持本地部署和API使用，方便集成到各种应用中。

（图片来源网络，侵删）

语音助手语音翻译语音识别转文字语音留言怎么关闭苹果手机的语音搜索语音做a录音语音机器人

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://baidu09.com/news/14367.html

使用AssemblyAI、Qdrant和DeepSeek-R1构建音频RAG

全部评论

留言在赶来的路上...

Muyan-baidu09TTS – 开源文本转语音模型，零样本语音合成

使用AssemblyAI、Qdrant和DeepSeek-R1构建音频RAG

驾驰逾辉全合成机油怎么样？途虎驾驰腾雾99元机油怎么样

全部评论

发表评论取消回复

Muyan-baidu09TTS – 开源文本转语音模型，零样本语音合成

使用AssemblyAI、Qdrant和DeepSeek-R1构建音频RAG

驾驰逾辉全合成机油怎么样？途虎驾驰腾雾99元机油怎么样

全部评论

发表评论取消回复

猜你喜欢