SPDL(Scalable and Performant Data Loading)是 推出的开源数据加载工具,能提高 AI 模型训练效率。基于多线程技术,实现高吞吐量数据加载,减少计算资源消耗。与传统基于进程的方法相比,SPDL 提升2-3倍的吞吐量,与 Free-Threaded Python 兼容,能在禁用 GIL 的环境中进一步提升30%的性能。SPDL 基于异步事件循环和线程安全操作优化数据加载,支持分布式系统和主流 AI 框架 PyTorch,适用于大规模数据集和复杂任务。

SPDL – Meta AI 推出的开源高性能AI模型数据加载解决方案  第1张
(图片来源网络,侵删)
SPDL – Meta AI 推出的开源高性能AI模型数据加载解决方案  第2张
(图片来源网络,侵删)