跳转到主内容
版本:开发版

设置页面排名

使用页面等级创建分步检索策略。


场景

在AI驱动的聊天中,您可以配置聊天助手或代理,使用从多个指定知识库(数据集)中检索到的知识进行响应,前提是它们使用相同的嵌入模型。在您希望某些知识库的信息优先或首先被检索的情况下,您可以使用RAGFlow的页面等级功能来提高这些知识库中区块的排名。例如,如果您配置了一个聊天助手,使其从两个知识库中获取信息,知识库A用于2024年的新闻,知识库B用于2023年的新闻,但希望优先考虑2024年的新闻,那么这个功能就特别有用。

注意

需要注意的是,这个“页面等级”功能作用于整个知识库,而不是单个文件或文档。

配置

在您的知识库的配置页面上,拖动页面等级下的滑块来设置知识库的页面等级值。您也可以在滑块旁边的字段中输入期望的页面等级值。

注意

页面等级值必须是整数。范围:[0, 100]

  • 0: 禁用 (默认)
  • 特定值:启用
注意

如果您将页面等级值设置为非整数,例如1.7,它将被向下取整到最接近的整数,即1。

评分机制

如果您将聊天助手的相似度阈值配置为0.2,那么只有混合分数大于0.2 x 100 = 20的区块才会被检索并发送给聊天模型以生成内容。这个初始过滤步骤对于筛选相关信息至关重要。

如果您为知识库A(2024年新闻)分配了页面等级1,为知识库B(2023年新闻)分配了页面等级0,那么检索到的区块的最终混合分数将相应调整。从知识库A中检索到的一个初始分数为50的区块将获得1 x 100 = 100分的加成,最终分数为50 + 1 x 100 = 150。这样,从知识库A中检索到的区块将总是排在知识库B的区块之前。