k1 视觉思考模型是推出的k1系列强化学习AI模型,原生支持端到端图像理解和思维链技术,将能力扩展到数学之外的更多基础科学领域。k1模型在图像理解、数学、物理、化学等学科的基准测试中表现优异,超过全球多个标杆模型(如OpenAI o1、GPT-4o以及 Claude 3.5 Sonnet)。k1 视觉思考模型能直接处理图像信息进行思考得出答案,无需借助外部OCR或视觉模型,提供完整的推理思维链,让用户看到模型思索答案的全过程。k1 视觉思考模型基于预训练和强化学习后训练,优化字符识别能力,在 OCRBench 上得到 903 分的当前最好(state-of-the-art)结果,在 MathVista-testmini、MMMU-val 和 DocVQA 基准测试集上分数分别为 69.1、66.7 和 96.9,处于全球领先水平。

同时,Kimi 模型研发团队推出针对基础科学学科的标准化图形测试集Science Vista,涵盖不同难度的数理化图片题目,从分布上与实际用户需求较为匹配。测试集将开放给全行业。