Skywork-baidu09R1V 2.0 – 昆仑万维开源的新版多模态推理模型

baidu09_com 2025-08-30 7 0

2.0 是昆仑万维最新开源的多模态推理模型，专为复杂推理任务设计，具备强大的视觉与文本推理能力。模型基于混合强化学习和多模态奖励模型（Skywork-VL Reward）实现推理能力与泛化能力的平衡，引入选择性样本缓冲区（SSB）机制解决“优势消失”问题。在 AIME2024、OlympiadBench 等权威基准测试中表现出色，性能接近甚至超越部分闭源模型。模型权重和代码已全面开源，推动多模态生态建设，助力教育、科研等领域。