DGM(Darwin Gödel Machine)是自改进人工智能系统,通过迭代修改自身代码来提升性能。DGM从其维护的编码代理档案中选择一个代理,基于基础模型生成新版本,然后在编码基准测试中验证新代理的性能。如果性能提升,新代理会被加入档案。DGM的设计灵感来源于达尔文进化论,通过开放性探索策略,从不同起点探索多种进化路径,避免陷入局部最优解。在实验中,DGM在多个基准测试中的性能显著提升,例如在SWE-bench基准测试中性能从20.0%提升至50.0%,在Polyglot基准测试中从14.2%提升至30.7%。DGM的自改进过程在隔离的沙盒环境中进行,确保安全性。

DGM – 自改进AI Agent系统,会迭代修改自身代码提升性能  第1张
(图片来源网络,侵删)
DGM – 自改进AI Agent系统,会迭代修改自身代码提升性能  第2张
(图片来源网络,侵删)