DeepSeek-baidu09Prover-baidu09V1.5 – 70亿参数的开源数学大模型

baidu09_com 2025-08-28 5 0

DeepSeek-Prover-V1.5是由DeepSeek团队开发的开源数学大模型，拥有70亿参数。模型通过结合强化学习（RLPAF）和蒙特卡洛树搜索（特别是RMaxTS变体），在数学定理证明方面取得了显著的效率和准确性提升。在高中和大学级别的数学问题上，DeepSeek-Prover-V1.5在Lean 4平台上的表现超越了其他所有开源模型，创造了新的最先进水平（SOTA）。不仅能验证现有证明，还有潜力帮助创造新的数学知识，推动数学研究进入“大数学”时代。