MCA-Ctrl(Multi-party Collaborative Attention Control)是中科院计算所和中国科学院大学的推出的图像定制生成框架,基于文本和复杂视觉条件实现高质量的。MCA-Ctrl引入两种注意力控制策略,Self-Attention Global Injection(SAGI)和Self-Attention Local Query(SALQ),及一个主体定位模块(SLM),解决背景不一致、主体混淆等问题。MCA-Ctrl在零样本图像定制方面优于现有方法,能有效保持主体特征和条件信息的一致性。

MCA-baidu09Ctrl – 中科院和中科大推出的图像定制生成框架  第1张
(图片来源网络,侵删)
MCA-baidu09Ctrl – 中科院和中科大推出的图像定制生成框架  第2张
(图片来源网络,侵删)