Mini DALL·E 3 是北京理工大学、上海AI Lab、清华大学和香港中文大学联合推出的交互式(iT2I)框架。基于自然语言与用户进行多轮对话,实现高质量图像的生成、编辑和优化。用户用简单的指令逐步细化图像要求,基于大型语言模型(LLM)和预训练的文本到图像模型(如 Stable Diffusion),无需额外训练生成与文本描述高度一致的图像。系统支持问答功能,为用户提供更连贯的交互体验,提升人机交互的便捷性和图像生成质量。

Mini DALL·E 3 – 北京理工联合上海 AI Lab等高校推出的交互式文生图框架  第1张
(图片来源网络,侵删)
Mini DALL·E 3 – 北京理工联合上海 AI Lab等高校推出的交互式文生图框架  第2张
(图片来源网络,侵删)