Infinity-MM是智源研究院推出的千万级多模态指令数据集,包含4300万条样本,数据量达10TB。数据集经过质量过滤和去重,确保高质量和多样性,能提升开源视觉-语言模型(VLMs)的性能。智源推出基于开源VLMs的合成数据生成方法,进一步扩充数据集规模和多样性。基于Infinity-MM,智源成功训练20亿参数的多模态模型Aquila-VL-2B,在同规模模型中取得最先进的性能。

(图片来源网络,侵删)

(图片来源网络,侵删)
Infinity-MM是智源研究院推出的千万级多模态指令数据集,包含4300万条样本,数据量达10TB。数据集经过质量过滤和去重,确保高质量和多样性,能提升开源视觉-语言模型(VLMs)的性能。智源推出基于开源VLMs的合成数据生成方法,进一步扩充数据集规模和多样性。基于Infinity-MM,智源成功训练20亿参数的多模态模型Aquila-VL-2B,在同规模模型中取得最先进的性能。
全部评论
留言在赶来的路上...
发表评论