LongCite – 清华推出的开源模型，提升LLMs的精准引用减少幻觉

baidu09_com 2025-08-29 7 0

LongCite是由清华大学推出的项目，旨在提升大型语言模型（LLMs）在长文本问答任务中的可信度和可验证性。项目通过生成细粒度的句子级引用，使用户能验证模型的回答是否准确。核心组成部分包括LongBench-Cite评估基准、CoF自动化数据构建流程、LongCite-45k数据集，以及基于该数据集训练的LongCite-8B和LongCite-9B模型。模型能理解长文本内容并提供准确的问答服务，同时附上直接查阅的文本引用，增强信息的透明度和可靠性。