DynamicControl是腾讯优图联合南洋理工、浙大等研究机构推出的集成多模态大语言模型(MLLM)推理能力的文本生成图像(T2I)任务新框架。DynamicControl通过自适应地选择不同条件,实现了动态多控制对齐,显著增强了图像生成的可控性,同时保持了图像质量和图像文本对齐。架构支持多种控制信号的动态组合,能根据条件的重要性和内部关系自适应选择不同数量和类型的条件,优化了生成更接近源图像的图像。

DynamicControl – 腾讯优图联合南洋理工等机构推出的动态条件控制图像生成新框架  第1张
(图片来源网络,侵删)