Kimina-Prover是月之暗面与Numina团队合作推出的大型数学定理证明模型,模型采用大规模强化学习训练,能以类似人类的方式进行推理,在Lean 4语言中严谨地证明数学定理。通过独特的“形式化推理模式”,在推理过程中穿插非形式化推理和Lean 4代码片段,模拟人类解决问题的策略。 Kimina-Prover在miniF2F基准测试中取得了80.7%的成绩,超过此前最佳水平10.6%,创下新高。性能随着模型规模增大和计算资源增加而显著提升,展现出高样本效率和良好的可扩展性。模型的1.5B和7B参数版本已开源。


全部评论
留言在赶来的路上...
发表评论