k1 视觉思考模型 – kimi推出的 k1 系列强化学习模型

baidu09_com 2025-08-31 11 0

k1 视觉思考模型是推出的k1系列强化学习AI模型，原生支持端到端图像理解和思维链技术，将能力扩展到数学之外的更多基础科学领域。k1模型在图像理解、数学、物理、化学等学科的基准测试中表现优异，超过全球多个标杆模型（如OpenAI o1、GPT-4o以及 Claude 3.5 Sonnet）。k1 视觉思考模型能直接处理图像信息进行思考得出答案，无需借助外部OCR或视觉模型，提供完整的推理思维链，让用户看到模型思索答案的全过程。k1 视觉思考模型基于预训练和强化学习后训练，优化字符识别能力，在 OCRBench 上得到 903 分的当前最好（state-of-the-art）结果，在 MathVista-testmini、MMMU-val 和 DocVQA 基准测试集上分数分别为 69.1、66.7 和 96.9，处于全球领先水平。

同时，Kimi 模型研发团队推出针对基础科学学科的标准化图形测试集Science Vista，涵盖不同难度的数理化图片题目，从分布上与实际用户需求较为匹配。测试集将开放给全行业。