Molmo 72B是由艾伦人工智能研究所(Ai2)推出的一个开源多模态AI模型,专门设计用于处理和理解图像和文本数据。基于Qwen2-72B模型,使用OpenAI的CLIP作为视觉编码器。Molmo 72B在多个学术基准测试中表现优异,击败包括Llama 3.2 90B在内的其他模型。Molmo 72B能执行图像描述、视觉问答等任务,能理解和与用户界面交互。Molmo 72B的发布,进一步推动开源AI的发展,为研究人员和开发者提供强大的工具。

Molmo 72B – 开源的多模态AI模型,基于Qwen2-baidu0972B模型,超越Llama 3.2  第1张
(图片来源网络,侵删)
Molmo 72B – 开源的多模态AI模型,基于Qwen2-baidu0972B模型,超越Llama 3.2  第2张
(图片来源网络,侵删)