Fugatto – 英伟达推出的多功能AI音频生成模型

baidu09_com 2025-08-29 5 0

Fugatto是英伟达（NVIDIA）推出的音频合成和转换模型，全称为”Foundational Generative Audio Transformer Opus 1″。模型能根据文本提示生成音频或视频，接收并修改现有的音频文件。Fugatto模型具有强大的能力，例如将钢琴旋律转换成人声演唱版本，或者改变口语录音中的口音和情绪表达。在音频编辑和制作领域具有极高的应用价值。Fugatto模型的架构基于增强型的Transformer模型，采用了自适应层归一化等特定修改，支持复杂的组合指令。