RAGflow[1,2][ELmo]

RAGFlow 是一个端到端的 RAG 引擎,它解决数据的问题,因为如果不对用户数据加以区分和清晰,识别其中的语义,就容易导致 Garbage In Garbage Out。RAGFlow 包含了如下的完整 RAG 流程,确保数据从 Garbage In Garbage Out 变为 Quality In Quality Out。

RAGFlow 的最大特色,就是多样化的文档智能处理,因此它没有采用现成的 RAG 中间件,而是完全重新研发了一套智能文档理解系统,并以此为依托构建 RAG 任务编排体系。

这个系统的特点包含:

  1. 它是一套基于 AI 模型的智能文档处理系统
  2. 它是一套包含各种不同模板的智能文档处理系统;
  3. 智能文档处理的可视化和可解释性
  4. RAGFlow 是一个完整的 RAG 系统,而目前开源的 RAG,大都忽视了 RAG 本身的最大优势之一:可以让 LLM 以可控的方式回答问题,或者换种说法:有理有据、消除幻觉。

DeepDoc

2.2.模型细节

模型地址:https://huggingface.co/InfiniFlow/deepdoc/tree/main

开源的都是onnx格式的模型,都很轻量级,10M左右,一共四种模型,分别是: