Modular RAG[1]

indexing

chunk优化
- small-to-big 用小块做索引，但召回大块
- sliding window 滑动窗口，提高语义连贯性
- summary摘要（解决跨文档）以及结构化的组织例如使用知识图谱进行文档内容的组织，根据文档结构进行层级组织

pre-retrival阶段

query-routing [2]
- Metadata Router/ Filter 问题的分发
- Semantic Router 意图分类 ***
query-expansion
- Multi-Query 一变多
- Sub-Query 拆分子query
- CoVe[3]
query transformer
- query rewrite改写 ***
- HyDE ***
- Step-back Prompting
query construction
- text-cypher
- text2sql
- 将结构化知识利用起来

Retrieval

Retriver Selection 检索方式的选择
- Sparse Retriever 稀疏检索（es字符串匹配）
- Dense Retriever 稠密检索（向量化检索）
Retriever Fine-tuning 检索的微调 [4] #
- SFT 【embedding tuning】
- adapter

post-retrieval 包括一些后处理的模块

rerank重排
- Rule-base Rerank 基于规则的
- Model-base Rerank 基于模型的基于大模型llm本身的
compresion/selection 上下文压缩
- llmlingua
- recomp
- selective context
- 核心在于利用不同的手段，将上下文中不重要的信息进行剔除

Generation阶段