设置页面排名
使用页面排名创建分步检索策略。
场景
在AI驱动的聊天中,您可以配置聊天助手或智能体,使用从多个指定的知识库(数据集)中检索到的知识进行响应,前提是它们使用了相同的嵌入模型。在您希望某些知识库中的信息优先或首先被检索到的情况下,您可以使用 RAGFlow 的页面排名功能来提高这些知识库中块(chunk)的排名。例如,如果您配置的聊天助手同时使用了两个知识库,知识库A存放2024年的新闻,知识库B存放2023年的新闻,但您希望优先检索2024年的新闻,此功能就非常有用。
注意
重要的是要注意,此“页面排名”功能作用于整个知识库级别,而不是针对单个文件或文档。
配置
在您的知识库的配置页面上,拖动页面排名下的滑块来设置您知识库的页面排名值。您也可以在滑块旁边的字段中输入期望的页面排名值。
注意
页面排名值必须是整数。范围:[0,100]
- 0:禁用(默认)
- 特定值:启用
注意
如果您将页面排名值设置为非整数,例如 1.7,它将被向下取整到最接近的整数,在此示例中为 1。
评分机制
如果您将聊天助手的相似度阈值配置为 0.2,则只有混合分数大于 0.2 x 100 = 20 的块(chunk)才会被检索并发送给聊天模型用于内容生成。这个初始过滤步骤对于缩小相关信息范围至关重要。
如果您为知识库 A(2024 年新闻)分配页面排名 1,为知识库 B(2023 年新闻)分配页面排名 0,则检索到的块(chunk)的最终混合分数将相应调整。从知识库 A 中检索到的初始分数为 50 的块(chunk)将获得 1 x 100 = 100 分的提升,最终分数为 50 + 1 x 100 = 150。通过这种方式,从知识库 A 检索到的块(chunk)总是会优先于从知识库 B 检索到的块(chunk)。