WarriorCoder 是华南理工大学计算机科学与工程学院和微软推出的代码生成大语言模型(LLM)。基于模拟专家模型之间的对抗生成高质量训练数据,提升模型性能。与传统方法不同,WarriorCoder 不依赖于现有的专有模型或数据集,从零开始挖掘指令,基于 Elo 评分系统和裁判模型评估对抗结果,选择最优响应作为训练数据。WarriorCoder整合多个开源代码专家模型的优势,避免数据收集过程中的人工参与和系统偏见。实验表明,WarriorCoder 在代码生成、代码推理和库使用等任务上达到新的 SOTA 性能,展现了强大的泛化能力和数据多样性。

WarriorCoder – 微软联合华南理工大学推出的代码生成大模型  第1张
(图片来源网络,侵删)
WarriorCoder – 微软联合华南理工大学推出的代码生成大模型  第2张
(图片来源网络,侵删)