MindOmni 是腾讯 ARC Lab 联合清华大学深圳国际研究生院、香港中文大学和香港大学等推出的多模态大型语言模型,基于强化学习算法(RGPO)显著提升视觉语言模型的推理生成能力。模型用三阶段训练策略,首先构建统一视觉语言模型,基于链式思考(CoT)数据进行监督微调,用 RGPO 算法优化推理生成。MindOmni 在多模态理解与生成任务中表现卓越,在数学推理等复杂场景下展现出强大的推理生成能力,为多模态 AI 的发展开辟新路径。


MindOmni 是腾讯 ARC Lab 联合清华大学深圳国际研究生院、香港中文大学和香港大学等推出的多模态大型语言模型,基于强化学习算法(RGPO)显著提升视觉语言模型的推理生成能力。模型用三阶段训练策略,首先构建统一视觉语言模型,基于链式思考(CoT)数据进行监督微调,用 RGPO 算法优化推理生成。MindOmni 在多模态理解与生成任务中表现卓越,在数学推理等复杂场景下展现出强大的推理生成能力,为多模态 AI 的发展开辟新路径。
全部评论
留言在赶来的路上...
发表评论