Infinity-MM是智源研究院推出的千万级多模态指令数据集,包含4300万条样本,数据量达10TB。数据集经过质量过滤和去重,确保高质量和多样性,能提升开源视觉-语言模型(VLMs)的性能。智源推出基于开源VLMs的合成数据生成方法,进一步扩充数据集规模和多样性。基于Infinity-MM,智源成功训练20亿参数的多模态模型Aquila-VL-2B,在同规模模型中取得最先进的性能。

Infinity-baidu09MM – 智源推出的千万级多模态指令数据集  第1张
(图片来源网络,侵删)
Infinity-baidu09MM – 智源推出的千万级多模态指令数据集  第2张
(图片来源网络,侵删)