什么是RAG系统中的偏见?  第1张Link: 

探讨了通过控制嵌入器来减轻 RAG 偏见的可能性。嵌入器指的是将文本数据转换为数字表示(称为嵌入)的模型或算法。这些嵌入捕捉了文本的语义,RAG 系统利用它们在生成回复之前从知识库中获取相关信息。考虑到这种关系,研究发现,反向偏置嵌入器可以消除整个 RAG 系统的偏置

此外,他们还发现,一个语料库中的最佳嵌入器仍然是语料库偏见变化的最佳嵌入器。最后,研究人员得出结论,大多数去偏见工作都集中在 RAG 系统的检索过程上,而这是不够的,正如前面所讨论的那样。

与传统的基于人工智能的 LLM 相比,基于 RAG 的 LLM 具有显著的优势,并能弥补其很多缺点。但它并不是万能的,这一点从它带来的公平性风险就能看出来。虽然 RAG 有助于减少幻觉并提高特定领域的准确性,但它也会无意中放大外部数据集中存在的偏见。即使是精心策划的数据也无法完全确保公平性,这就凸显出需要更强大的缓解策略。RAG 需要更好的保障机制来防止公平性下降,而总结和偏见感知检索在降低风险方面发挥着关键作用。