TokenVerse 是基于预训练文本到图像扩散模型的多概念个性化方法。能从单张图像中解耦复杂的视觉元素和属性,从多张图像中提取概念进行无缝组合生成。支持多种概念,包括物体、配饰、材质、姿势和光照等,突破了现有技术在概念类型或广度上的限制。 TokenVerse 基于 DiT 模型的调制空间,通过优化框架为每个词汇找到独特的调制空间方向,实现对复杂概念的局部控制。在个性化图像生成领域具有显著优势,能满足设计师、艺术家和内容创作者在不同场景下的多样化需求。

TokenVerse – DeepMind等机构推出的多概念个性化图像生成方法  第1张
(图片来源网络,侵删)
TokenVerse – DeepMind等机构推出的多概念个性化图像生成方法  第2张
(图片来源网络,侵删)