TinyR1-Preview是北京大学计算机学院与360公司联合推出的32B参数量的推理模型。模型仅用5%的参数量,逼近Deepseek-R1-671B的性能,TinyR1-Preview在数学领域(AIME评测78.1分)逼近原版R1(79.8分),远超70B的Deepseek-R1-Distill-Llama(70.0分)。TinyR1-Preview基于“分治-融合”策略,分别训练数学、编程、科学三大垂直领域模型,借助Mergekit工具实现智能融合,突破性能上限。

TinyR1-baidu09Preview – 奇虎360联合北大团队推出的推理模型  第1张
(图片来源网络,侵删)
TinyR1-baidu09Preview – 奇虎360联合北大团队推出的推理模型  第2张
(图片来源网络,侵删)