Mini DALL·E 3 是北京理工大学、上海AI Lab、清华大学和香港中文大学联合推出的交互式(iT2I)框架。基于自然语言与用户进行多轮对话,实现高质量图像的生成、编辑和优化。用户用简单的指令逐步细化图像要求,基于大型语言模型(LLM)和预训练的文本到图像模型(如 Stable Diffusion),无需额外训练生成与文本描述高度一致的图像。系统支持问答功能,为用户提供更连贯的交互体验,提升人机交互的便捷性和图像生成质量。


Mini DALL·E 3 是北京理工大学、上海AI Lab、清华大学和香港中文大学联合推出的交互式(iT2I)框架。基于自然语言与用户进行多轮对话,实现高质量图像的生成、编辑和优化。用户用简单的指令逐步细化图像要求,基于大型语言模型(LLM)和预训练的文本到图像模型(如 Stable Diffusion),无需额外训练生成与文本描述高度一致的图像。系统支持问答功能,为用户提供更连贯的交互体验,提升人机交互的便捷性和图像生成质量。
全部评论
留言在赶来的路上...
发表评论