MiniRAG是香港大学推出的新型检索增强型生成(RAG)系统,专为在资源受限的场景下高效部署小型语言模型(SLMs)设计。MiniRAG基于两个关键技术实现这一目标:一是语义感知的异构图索引机制,将文本片段和命名实体结合,减少对复杂语义理解的依赖;二是轻量级拓扑增强检索方法,用图结构进行高效知识发现,无需高级语言能力。MiniRAG在实验中展现出与大型语言模型(LLMs)方法相当的性能,同时仅需25%的存储空间。MiniRAG提供全面的基准数据集,评估轻量级RAG系统在现实设备场景下的表现,推动资源受限环境下高效、私密的RAG系统的发展。

MiniRAG – 港大推出高效部署小语言模型的新型 RAG 系统  第1张
(图片来源网络,侵删)
MiniRAG – 港大推出高效部署小语言模型的新型 RAG 系统  第2张
(图片来源网络,侵删)