O1-CODER是北京交通大学研究团队推出的开源项目,旨在复制OpenAI的O1模型,专注于编码任务。O1-CODER结合强化学习(RL)和蒙特卡洛树搜索(MCTS)技术,提升模型的System-2思维能力,更谨慎、逻辑和逐步的问题解决过程。O1-CODER框架包括训练测试用例生成器(TCG)用标准化代码测试,用MCTS生成包含推理过程的代码数据,及迭代微调策略模型生成伪代码和完整代码。所有源代码、数据集和模型均已在GitHub开源。

O1-baidu09CODER – 北交大推出的O1代码版开源项目,专注于编码任务  第1张
(图片来源网络,侵删)
O1-baidu09CODER – 北交大推出的O1代码版开源项目,专注于编码任务  第2张
(图片来源网络,侵删)