MCA-Ctrl(Multi-party Collaborative Attention Control)是中科院计算所和中国科学院大学的推出的图像定制生成框架,基于文本和复杂视觉条件实现高质量的。MCA-Ctrl引入两种注意力控制策略,Self-Attention Global Injection(SAGI)和Self-Attention Local Query(SALQ),及一个主体定位模块(SLM),解决背景不一致、主体混淆等问题。MCA-Ctrl在零样本图像定制方面优于现有方法,能有效保持主体特征和条件信息的一致性。

(图片来源网络,侵删)

(图片来源网络,侵删)
全部评论
留言在赶来的路上...
发表评论