JanusFlow是DeepSeek推出的 Janus 系列,用在多模态理解和生成任务的模型,整合自回归语言模型与校正流技术,在单一模型中实现图像理解和生成。框架基于解耦的视觉编码器和表示对齐策略,提升模型在不同任务上的性能,在多个标准基准测试中显示出与专业模型相当或更优的结果,在视觉理解上,超过了LLaVA-v1.5、Qwen-VL-Chat,在图像生成上,超过Stable Diffusion v1.5、SDXL。

JanusFlow – DeepSeek开源多模态理解与生成任务统一的框架  第1张
(图片来源网络,侵删)
JanusFlow – DeepSeek开源多模态理解与生成任务统一的框架  第2张
(图片来源网络,侵删)