DeepEyes 是小红书团队和西安交通大学联合推出的多模态深度思考模型。基于端到端强化学习,实现类似 的“用图思考”能力,无需依赖监督微调(SFT)。DeepEyes 在推理过程中动态调用图像工具,如裁剪和缩放,增强对细节的感知与理解。模型在视觉推理基准测试 V* Bench 上准确率高达 90.1%,展现出强大的视觉搜索和多模态推理能力。DeepEyes 具备出色的图像定位能力,能有效减少幻觉现象,提升模型的可靠性和泛化能力。

DeepEyes – 小红书联合西安交大推出的多模态深度思考模型  第1张
(图片来源网络,侵删)
DeepEyes – 小红书联合西安交大推出的多模态深度思考模型  第2张
(图片来源网络,侵删)