Meissonic – 阿里联合多所高校推出的文本到图像合成模型

baidu09_com 2025-08-30 7 0

Meissonic是由阿里巴巴集团、Skywork AI等多所大学合作推出的文本到图像合成模型。基于掩蔽图像建模技术，结合多模态和单模态Transformer层、高级位置编码策略和优化的采样条件，提升图像生成的效率和性能。模型用1B参数，依赖高质量训练数据、微条件和特征压缩层，生成高质量、高分辨率图像，性能与大型扩散模型相当。在多个基准测试中表现优异，易于在普通电脑上运行，无需额外优化，为移动端文本到图像生成提供新的可能性。