PlayDiffusion – Play AI开源的音频编辑模型

baidu09_com 2025-08-30 14 0

PlayDiffusion是Play AI推出的新型音频编辑模型，基于扩散模型技术，专门用在音频的精细编辑和修复。模型将音频编码为离散的标记序列，对需要修改的部分进行掩码处理，用扩散模型在给定更新文本的条件下对掩码区域进行去噪，实现高质量的音频编辑。模型能无缝保留上下文，确保语音的连贯性和自然性，同时支持高效的文本到语音合成。PlayDiffusion的非自回归特性在生成速度和质量上优于传统的自回归模型，为音频编辑和语音合成领域带来新的突破。