Matryoshka Diffusion Models(MDM)是由苹果公司研究人员推出的一种新型扩散模型框架,旨在解决生成高分辨率图像和视频时面临的计算和优化挑战。MDM基于在多个分辨率上联合去噪的扩散过程,采用嵌套UNet架构,实了小尺度模型嵌套在大尺度模型中的特征,促进不同尺度间的特征共享,支持从低分辨率到高分辨率的渐进式训练策略。显著提高高分辨率生成的优化效率,在多个基准测试中展现优异的性能,包括在ImageNet数据集上的类条件图像生成及高分辨率的文本到图像和文本到视频的应用。MDM能训练高达1024×1024像素分辨率的单像素空间模型,在较小的数据集上展示强大的零样本泛化能力。

MDM – 苹果推出开源的新型扩散模型框架  第1张
(图片来源网络,侵删)
MDM – 苹果推出开源的新型扩散模型框架  第2张
(图片来源网络,侵删)