加速索引
一份旨在加快文档解析和索引速度的检查清单。
请注意,您的一些设置可能会消耗大量时间。如果您经常发现文档解析耗时较长,可以参考以下检查清单:
- 使用 GPU 以减少嵌入时间。
- 在知识库的配置页面,关闭**使用 RAPTOR 增强检索**。
- 提取知识图谱 (GraphRAG) 非常耗时。
- 在知识库的配置页面,禁用**自动关键词**和**自动问题**,因为这两项都依赖于大语言模型 (LLM)。
- v0.17.0+: 如果您知识库中的所有 PDF 都是纯文本,并且不需要 OCR(光学字符识别)、TSR(表格结构识别)或 DLA(文档布局分析)等 GPU 密集型处理,您可以在**文档解析器**下拉菜单中选择 **Naive**,而不是 **DeepDoc** 或其他耗时的大模型选项。这将显著减少文档解析时间。