VideoPoet是由谷歌的研究团队开发的一种基于大模型的AI视频生成方案,支持从文本、图像或视频输入中合成高质量的视频内容,并生成匹配的音频。VideoPoet的核心优势在于其多模态大模型的设计,可以处理和转换不同类型的输入信号,无需特定数据集或扩散模型,就能够实现多种风格和动作的视频输出,支持生成时长10秒的视频。

VideoPoet – 谷歌推出的AI视频生成模型  第1张
(图片来源网络,侵删)
VideoPoet – 谷歌推出的AI视频生成模型  第2张
(图片来源网络,侵删)