DeepEyes – 小红书联合西安交大推出的多模态深度思考模型

baidu09_com 2025-08-28 5 0

DeepEyes 是小红书团队和西安交通大学联合推出的多模态深度思考模型。基于端到端强化学习，实现类似的“用图思考”能力，无需依赖监督微调（SFT）。DeepEyes 在推理过程中动态调用图像工具，如裁剪和缩放，增强对细节的感知与理解。模型在视觉推理基准测试 V* Bench 上准确率高达 90.1%，展现出强大的视觉搜索和多模态推理能力。DeepEyes 具备出色的图像定位能力，能有效减少幻觉现象，提升模型的可靠性和泛化能力。