书生·万象InternVL 2.5是上海AI实验室的OpenGVLab团队推出的开源多模态大型语言模型(MLLM)系列。该系列模型在InternVL 2.0的基础上进行显著增强,特别是在训练和测试策略及数据质量方面。InternVL 2.5包括从1B到78B不同规模的模型,适应不同的使用场景和硬件需求。InternVL2_5-78B是首个在多模态理解基准(MMMU)上得分超过70的开源模型,超越ChatGPT-4o和Claude-3.5-Sonnet等商业模型。InternVL 2.5基于链式思考(CoT)推理技术实现性能提升,在多学科推理、文档理解、多图像/视频理解等多个基准测试中展现强大的多模态能力。

书生·万象InternVL 2.5 – 上海 AI Lab 开源的多模态大语言模型系列  第1张
(图片来源网络,侵删)
书生·万象InternVL 2.5 – 上海 AI Lab 开源的多模态大语言模型系列  第2张
(图片来源网络,侵删)