Add-it是NVIDIA推出的无需训练的图像编辑技术,能根据文本指令在图像中添加对象。这项技术基于扩展扩散模型的注意力机制,整合场景图像、文本提示和生成图像的信息,实现结构一致性和自然的对象放置。Add-it在真实和生成图像的插入基准测试中表现优异,优于监督学习方法,且在超过80%的情况下更受人类偏好。

Add-baidu09it – 英伟达推出无需训练的图像编辑技术  第1张
(图片来源网络,侵删)
Add-baidu09it – 英伟达推出无需训练的图像编辑技术  第2张
(图片来源网络,侵删)