SeedVR是南洋理工大学和字节跳动推出的扩散变换器模型,能实现高质量的通用视频修复。SeedVR基于引入移位窗口注意力机制,采用大尺寸(64×64)窗口和边界处的可变大小窗口,有效处理任意长度和分辨率的视频,克服传统方法在不同分辨率下的性能限制。SeedVR结合因果视频变分自编码器(CVVAE),基于时间和空间压缩降低计算成本,同时保持高重建质量。基于大规模图像和视频联合训练及多阶段渐进式训练策略,SeedVR在多个视频修复基准测试中表现出色,尤其在感知质量方面,能生成具有真实感细节的修复视频,且速度优于现有方法。

全部评论
留言在赶来的路上...
发表评论