Molmo 72B是由艾伦人工智能研究所(Ai2)推出的一个开源多模态AI模型,专门设计用于处理和理解图像和文本数据。基于Qwen2-72B模型,使用OpenAI的CLIP作为视觉编码器。Molmo 72B在多个学术基准测试中表现优异,击败包括Llama 3.2 90B在内的其他模型。Molmo 72B能执行图像描述、视觉问答等任务,能理解和与用户界面交互。Molmo 72B的发布,进一步推动开源AI的发展,为研究人员和开发者提供强大的工具。


Molmo 72B是由艾伦人工智能研究所(Ai2)推出的一个开源多模态AI模型,专门设计用于处理和理解图像和文本数据。基于Qwen2-72B模型,使用OpenAI的CLIP作为视觉编码器。Molmo 72B在多个学术基准测试中表现优异,击败包括Llama 3.2 90B在内的其他模型。Molmo 72B能执行图像描述、视觉问答等任务,能理解和与用户界面交互。Molmo 72B的发布,进一步推动开源AI的发展,为研究人员和开发者提供强大的工具。
全部评论
留言在赶来的路上...
发表评论