跳到主要内容
版本: DEV

检索组件

从指定数据集中检索信息的组件。

场景

检索组件在大多数 RAG 场景中至关重要,它从指定的知识库中提取信息,然后发送给 LLM 生成内容。

配置

点击检索组件以打开其配置窗口。

输入

检索组件依赖输入变量来指定其数据输入(查询)。点击输入部分的 + 添加变量来添加所需的输入变量。输入变量有两种类型:引用文本

  • 引用:使用组件的输出或用户输入作为数据源。您需要从下拉菜单中选择
    • 组件输出下选择一个组件 ID,或者
    • 开始输入下选择一个全局变量,该变量在开始组件中定义。
  • 文本:使用固定文本作为查询。您需要输入静态文本。

相似度阈值

RAGFlow 在检索时结合了加权关键词相似度和加权向量余弦相似度。此参数设置用户查询与数据集中存储的块(chunk)之间的相似度阈值。任何相似度分数低于此阈值的块都将从结果中排除。

默认为 0.2。

关键词相似度权重

此参数设置关键词相似度在组合相似度分数中的权重。两个权重的总和必须等于 1.0。其默认值为 0.7,这意味着向量相似度在组合搜索中的权重为 1 - 0.7 = 0.3。

Top N

此参数从检索到的块中选择“Top N”个,并将其馈送给 LLM。

默认为 8。

重排模型

可选

如果选择了重排模型,检索时将使用加权关键词相似度和加权重排分数的组合。

警告

使用重排模型将显著增加系统的响应时间。

Tavily API 密钥

可选

在此输入您的 Tavily API 密钥,以在检索期间启用 Tavily 网页搜索。有关获取 Tavily API 密钥的说明,请参见此处

使用知识图谱

在检索时是否在指定的知识库中使用知识图谱进行多跳问答。启用此选项后,将涉及对实体、关系和社区报告块进行迭代搜索,这将极大地增加检索时间。

知识库

可选

选择要从中检索数据的知识库。

  • 如果没有选择知识库(意味着与智能体的对话将不基于任何知识库),请确保空回复字段留空以避免出错。
  • 如果您选择多个知识库,必须确保您选择的知识库(数据集)使用相同的嵌入模型;否则会出错。

空回复

  • 如果您的查询未能从知识库中检索到任何结果,则将其设置为回复,或者
  • 将此字段留空,以便在找不到任何内容时允许聊天模型自由发挥。
警告

如果您没有指定知识库,必须将此字段留空;否则会出错。

示例

探索我们的客服智能体模板,其中检索组件(组件 ID:搜索产品信息)用于搜索数据集并将 Top N 结果发送给 LLM

  1. 点击页面顶部中央的智能体标签,访问智能体页面。
  2. 点击页面右上角的 + 创建智能体以打开智能体模板页面。
  3. 智能体模板页面上,将鼠标悬停在客户服务卡片上,然后点击使用此模板
  4. 命名您的新智能体并点击确定进入工作流编辑器。
  5. 点击检索组件以显示其配置窗口。