CogSound是智谱AI最新推出的音效模型,能为无声视频增添动人的音效。 基于的视频理解能力,CogSound能精准识别理解视频背后的语义和情感,为无声视频添加与之相匹配的音频内容,可以生成更复杂的音效,如爆炸、水流、乐器、动物叫声、交通工具声等。模型的推出标志着智谱AI在视频生成领域的技术进步,特别是在提升视频的多模态体验方面,增强视频的沉浸感和真实感。

CogSound – 智谱AI最新推出的音效模型  第1张
(图片来源网络,侵删)
CogSound – 智谱AI最新推出的音效模型  第2张
(图片来源网络,侵删)