LinGen是普林斯顿大学和Meta共同推出的新型文本到框架。框架基于线性复杂度的MATE模块(包含MA-branch和TE-branch),替换传统Diffusion Transformers中的二次复杂度的自注意力模块,实现在单个GPU上高效生成高分辨率、分钟级时长的视频。LinGen显著降低计算成本,保持高质量的视频输出,在视频质量和生成效率上均优于现有的先进模型,为长视频生成和实时交互式视频应用开辟新的道路。


LinGen是普林斯顿大学和Meta共同推出的新型文本到框架。框架基于线性复杂度的MATE模块(包含MA-branch和TE-branch),替换传统Diffusion Transformers中的二次复杂度的自注意力模块,实现在单个GPU上高效生成高分辨率、分钟级时长的视频。LinGen显著降低计算成本,保持高质量的视频输出,在视频质量和生成效率上均优于现有的先进模型,为长视频生成和实时交互式视频应用开辟新的道路。
全部评论
留言在赶来的路上...
发表评论