LinGen是普林斯顿大学和Meta共同推出的新型文本到框架。框架基于线性复杂度的MATE模块(包含MA-branch和TE-branch),替换传统Diffusion Transformers中的二次复杂度的自注意力模块,实现在单个GPU上高效生成高分辨率、分钟级时长的视频。LinGen显著降低计算成本,保持高质量的视频输出,在视频质量和生成效率上均优于现有的先进模型,为长视频生成和实时交互式视频应用开辟新的道路。

LinGen – Meta联合普林斯顿大学推出的文本到视频生成框架  第1张
(图片来源网络,侵删)
LinGen – Meta联合普林斯顿大学推出的文本到视频生成框架  第2张
(图片来源网络,侵删)