版本：开发版

检索组件

该组件从指定的数据集中检索信息。

使用场景

在大多数 RAG 场景中，检索组件都是必不可少的，它在将信息发送给 LLM 进行内容生成之前，从指定的知识库中提取信息。自 v0.20.0 起，检索组件可以作为工作流组件或 Agent 的工具运行，从而使 Agent 能够控制其调用和搜索查询。

配置

点击检索组件以打开其配置窗口。

查询变量

必填

选择用于检索的查询源。

检索组件依赖查询变量来指定其数据输入（查询）。在检索组件之前定义的所有全局变量都可在下拉列表中找到。

知识库

选择要从中检索数据的知识库。

如果未选择任何知识库，即与 Agent 的对话将不基于任何知识库，请确保将空回复字段留空，以避免出错。
如果选择多个知识库，必须确保所选的知识库（数据集）使用相同的嵌入模型；否则，将出现错误消息。

相似度阈值

RAGFlow 在检索过程中采用加权关键词相似度和加权向量余弦相似度的组合。此参数设置用户查询与数据集中存储的 Chunk 之间的相似度阈值。任何相似度分数低于此阈值的 Chunk 都将从结果中排除。

默认为 0.2。

关键词相似度权重

此参数设置关键词相似度在组合相似度分数中的权重。两个权重的总和必须等于 1.0。其默认值为 0.7，这意味着向量相似度在组合搜索中的权重为 1 - 0.7 = 0.3。

Top N

此参数从检索到的 Chunk 中选择“Top N”个，并将其提供给 LLM。

默认为 8。

重排模型

可选

如果选择了重排模型，将使用加权关键词相似度和加权重排分数的组合进行检索。

警告

使用重排模型将显著增加系统的响应时间。

空回复

如果从知识库中未检索到与您的查询相关的结果，则将此设置为响应，或者
将此字段留空，以允许聊天模型在未找到任何内容时即兴发挥。

警告

如果您未指定知识库，则必须将此字段留空；否则，将出现错误。

跨语言搜索

选择一种或多种语言进行跨语言搜索。如果未选择任何语言，系统将使用原始查询进行搜索。

使用知识图谱

是否在检索过程中使用指定知识库中的知识图谱进行多跳问答。启用此功能后，将涉及对实体、关系和社区报告 Chunk 的迭代搜索，从而大大增加检索时间。

输出

检索组件输出的全局变量名称，可供工作流中的其他组件引用。

检索组件

使用场景​

配置​

查询变量​

知识库​

相似度阈值​

关键词相似度权重​

Top N​

重排模型​

空回复​

跨语言搜索​

使用知识图谱​

输出​