跳转到主内容
版本:开发版

检索组件

该组件从指定的数据集中检索信息。

使用场景

在大多数 RAG 场景中,检索组件都是必不可少的,它在将信息发送给 LLM 进行内容生成之前,从指定的知识库中提取信息。自 v0.20.0 起,检索组件可以作为工作流组件或 Agent 的工具运行,从而使 Agent 能够控制其调用和搜索查询。

配置

点击检索组件以打开其配置窗口。

查询变量

必填

选择用于检索的查询源。

检索组件依赖查询变量来指定其数据输入(查询)。在检索组件之前定义的所有全局变量都可在下拉列表中找到。

知识库

选择要从中检索数据的知识库。

  • 如果未选择任何知识库,即与 Agent 的对话将不基于任何知识库,请确保将空回复字段留空,以避免出错。
  • 如果选择多个知识库,必须确保所选的知识库(数据集)使用相同的嵌入模型;否则,将出现错误消息。

相似度阈值

RAGFlow 在检索过程中采用加权关键词相似度和加权向量余弦相似度的组合。此参数设置用户查询与数据集中存储的 Chunk 之间的相似度阈值。任何相似度分数低于此阈值的 Chunk 都将从结果中排除。

默认为 0.2。

关键词相似度权重

此参数设置关键词相似度在组合相似度分数中的权重。两个权重的总和必须等于 1.0。其默认值为 0.7,这意味着向量相似度在组合搜索中的权重为 1 - 0.7 = 0.3。

Top N

此参数从检索到的 Chunk 中选择“Top N”个,并将其提供给 LLM。

默认为 8。

重排模型

可选

如果选择了重排模型,将使用加权关键词相似度和加权重排分数的组合进行检索。

警告

使用重排模型将显著增加系统的响应时间。

空回复

  • 如果从知识库中未检索到与您的查询相关的结果,则将此设置为响应,或者
  • 将此字段留空,以允许聊天模型在未找到任何内容时即兴发挥。
警告

如果您未指定知识库,则必须将此字段留空;否则,将出现错误。

选择一种或多种语言进行跨语言搜索。如果未选择任何语言,系统将使用原始查询进行搜索。

使用知识图谱

是否在检索过程中使用指定知识库中的知识图谱进行多跳问答。启用此功能后,将涉及对实体、关系和社区报告 Chunk 的迭代搜索,从而大大增加检索时间。

输出

检索组件输出的全局变量名称,可供工作流中的其他组件引用。