Voice Changer是Cartesia推出的新模型,能将任何音频剪辑的语音转换成其他音色,且保留原始音频的情感和表达。用户从Cartesia提供的多种高质量声音库中选择,或克隆自己的声音,且完全控制语音的细节,如发声、情感和韵律。Voice Changer适于创作者制作独特内容、游戏和娱乐领域的角色配音、听众转换音频书籍和播客,及企业制作品牌音频。Voice Changer基于状态空间模型架构,提供高质量的音频生成和处理能力。

Voice Changer基于Cartesia在状态空间模型(State Space Models,简称SSM)架构上的开创性工作。SSM是用在处理和生成高分辨率数据(如音频)的先进方法,具有以下特点:

Voice Changer – Cartesia推出转换声音同时保留原始情感的变声器模型  第1张
(图片来源网络,侵删)
Voice Changer – Cartesia推出转换声音同时保留原始情感的变声器模型  第2张
(图片来源网络,侵删)