Inf-DiT 是清华大学、智谱AI 推出基于扩散模型的图像上采样方法,能生成超高分辨率图像。Inf-DiT引入单向块注意力机制(UniBA),将生成过程中的空间复杂度从 O(N^2) 降低到 O(N),有效解决传统扩散模型在生成大尺寸图像时内存消耗过高的问题。Inf-DiT 用扩散变换器(DiT)结构,能处理各种形状和分辨率的图像上采样任务。Inf-DiT设计多种技术增强图像的局部和全局一致性,如用全局图像嵌入和邻近低分辨率块的交叉注意力机制,进一步提升生成图像的质量和一致性。实验结果表明,Inf-DiT 在超高分辨率图像生成和超分辨率任务中均达到了 SOTA 性能。

(图片来源网络,侵删)

(图片来源网络,侵删)
全部评论
留言在赶来的路上...
发表评论