SmolDocling(SmolDocling-256M-preview )是高效轻量级的多模态文档处理模型。能将文档图像端到端地转换为结构化文本,支持文本、公式、图表等多种元素识别,适用于学术论文、技术报告等多类型文档。模型参数量仅 256M,推理速度快,A100 GPU 上每页处理仅需 0.35 秒,与 Docling 完全兼容,可导出多种格式。

SmolDocling – 轻量级的多模态文档处理模型  第1张
(图片来源网络,侵删)
SmolDocling – 轻量级的多模态文档处理模型  第2张
(图片来源网络,侵删)