LongRAG是清华大学、中国科学院和智谱的研究团队推出的,面向长文本问答(LCQA)的双视角鲁棒检索增强生成(RAG)框架。基于混合检索器、LLM增强信息提取器、CoT引导过滤器和LLM增强生成器四个组件,有效解决长文本问答中的全局上下文理解和事实细节识别难题。LongRAG在多个数据集上超越长上下文LLM、高级RAG系统和Vanilla RAG等基线模型,展现出卓越的性能和鲁棒性。LongRAG提供自动化微调数据构建管道,增强系统的“指令跟随”能力和领域适应性。

LongRAG – 智谱联合清华和中科院推出的双视角鲁棒检索框架  第1张
(图片来源网络,侵删)