Modular RAG[1]

indexing
- chunk优化
- small-to-big
用小块做索引,但召回大块
- sliding window
滑动窗口,提高语义连贯性
- summary摘要(解决跨文档)以及结构化的组织
例如使用知识图谱进行文档内容的组织,根据文档结构进行层级组织
pre-retrival阶段
- query-routing [2]
- Metadata Router/ Filter 问题的分发
- Semantic Router 意图分类 ***
- query-expansion
- Multi-Query 一变多
- Sub-Query 拆分子query
- CoVe[3]
- query transformer
- query rewrite改写 ***
- HyDE ***
- Step-back Prompting
- query construction
- text-cypher
- text2sql
- 将结构化知识利用起来
Retrieval
- Retriver Selection 检索方式的选择
- Sparse Retriever
稀疏检索(es字符串匹配)
- Dense Retriever
稠密检索(向量化检索)
- Retriever Fine-tuning 检索的微调 [4] #
- SFT
【embedding tuning】
- adapter
post-retrieval 包括一些后处理的模块
- rerank重排
- Rule-base Rerank 基于规则的
- Model-base Rerank 基于模型的
基于大模型llm本身的
- compresion/selection 上下文压缩
- llmlingua
- recomp
- selective context
- 核心在于利用不同的手段,将上下文中不重要的信息进行剔除
Generation阶段