RAGFlow 是一个端到端的 RAG 引擎,它解决数据的问题,因为如果不对用户数据加以区分和清晰,识别其中的语义,就容易导致 Garbage In Garbage Out。RAGFlow 包含了如下的完整 RAG 流程,确保数据从 Garbage In Garbage Out 变为 Quality In Quality Out。
RAGFlow 的最大特色,就是多样化的文档智能处理,因此它没有采用现成的 RAG 中间件,而是完全重新研发了一套智能文档理解系统,并以此为依托构建 RAG 任务编排体系。
这个系统的特点包含:
2.2.模型细节
模型地址:https://huggingface.co/InfiniFlow/deepdoc/tree/main
开源的都是onnx格式的模型,都很轻量级,10M左右,一共四种模型,分别是: