论文

论文地址

Seven Failure Points When Engineering a Retrieval Augmented Generation System

Key

一、丢失内容（ Missing Content ）

提问的问题，无法在被检索文档库中找到，最准确的答案是缺失的。
比较好的情况是回答"我不知道"。但事实上，它却会编造一个看似正确的错误答案。

二、错过了最相关的文档（ Missed the Top Ranked Documents ）

问题的答案在文档库中，但排名得分不够高，无法返回给用户。
理论上，检索过程中所有文档都会被排名得分。然而，在实际操作中，会返回排名前K个文档，为了提高召回率，K不可能设置的无限大，必须基于LLM大模型的能力，折中选择的一个值。

三、不在上下文中（Not in Context - Consolidation strategy Limitations）

有时候，可能会检索到大量的的文档，受限于模型的context大小限制，需要进行整合修剪才能传给大模型，但这有可能导致真正包含的答案未能放进上下文中。这种情况一样会导致模型产生幻觉，除非Prompt明确指示模型不返回不在上下文中的结果。

四、无法提取（Not Extracted ）