跳转到主内容
版本:开发版

开始 AI 对话

通过配置好的聊天助手,发起一场由 AI 驱动的对话。


知识库、无幻觉聊天和文件管理是 RAGFlow 的三大支柱。在 RAGFlow 中,聊天基于一个或多个特定的知识库。一旦您创建了知识库、完成了文件解析并运行了检索测试,您就可以开始进行 AI 对话了。

开始 AI 对话

您可以通过创建助手来开始 AI 对话。

  1. 点击页面中上方的对话标签页 > 创建助手,以显示您下一个对话对话配置对话框。

    RAGFlow 允许您为每个对话灵活选择不同的聊天模型,同时也允许您在系统模型设置中设置默认模型。

  2. 更新助手设置

    • 助手名称是您聊天助手的名称。每个助手对应一个具有独特知识库、提示词、混合搜索配置和大型模型设置组合的对话。
    • 空回复:
      • 如果您希望将 RAGFlow 的回答限定在您的知识库范围内,请在此处留下回复。这样,当它无法检索到答案时,会统一使用您在此处设置的内容进行回复。
      • 如果您希望 RAGFlow 在无法从知识库中检索到答案时自由发挥,请将此项留空,但这可能会导致幻觉的产生。
    • 显示引用:这是 RAGFlow 的一项关键功能,默认启用。RAGFlow 不像一个黑匣子。相反,它会清楚地显示其回答所依据的信息来源。
    • 选择相应的知识库。您可以选择一个或多个知识库,但请确保它们使用相同的嵌入模型,否则会发生错误。
  3. 更新提示词引擎

    • 系统中,您为大语言模型(LLM)填写提示词,刚开始时您也可以保留默认提示词。
    • 相似度阈值为每个文本块设置相似度的“门槛”。默认值为 0.2。相似度分数较低的文本块将被从最终回复中过滤掉。
    • 关键词相似度权重默认为 0.7。RAGFlow 使用混合评分系统来评估不同文本块的相关性。此值设置了混合评分中关键词相似度组件的权重。
      • 如果重排模型留空,混合评分系统将使用关键词相似度和向量相似度,向量相似度组件的默认权重为 1-0.7=0.3。
      • 如果选择了重排模型,混合评分系统将使用关键词相似度和重排器分数,重排器分数的默认权重为 1-0.7=0.3。
    • Top N 决定了提供给大语言模型(LLM)的最大文本块数量。换句话说,即使检索到更多的文本块,也只有前 N 个文本块会作为输入。
    • 多轮优化在多轮对话中利用现有上下文来增强用户查询。此功能默认启用。启用后,它会消耗额外的大语言模型(LLM) token,并显著增加生成答案的时间。
    • 使用知识图谱表示在检索过程中是否使用指定知识库中的知识图谱进行多跳问答。启用后,这会涉及在实体、关系和社群报告块之间进行迭代搜索,从而大大增加检索时间。
    • 推理表示是否通过 Deepseek-R1/OpenAI o1 等推理过程生成答案。一旦启用,聊天模型在问答时遇到未知主题时,会自主地整合深度研究。这包括聊天模型动态搜索外部知识并通过推理生成最终答案。
    • 重排模型设置要使用的重排模型。默认留空。
      • 如果重排模型留空,混合评分系统将使用关键词相似度和向量相似度,向量相似度组件的默认权重为 1-0.7=0.3。
      • 如果选择了重排模型,混合评分系统将使用关键词相似度和重排器分数,重排器分数的默认权重为 1-0.7=0.3。
    • 跨语言搜索:可选
      从下拉菜单中选择一个或多个目标语言。系统的默认聊天模型随后会将您的查询翻译成所选的目标语言。这种翻译确保了跨语言的准确语义匹配,使您能够检索到相关的结果,无论语言差异如何。
      • 在选择目标语言时,请确保这些语言存在于知识库中,以保证有效搜索。
      • 如果未选择目标语言,系统将仅在您的查询语言中进行搜索,这可能会导致错过其他语言中的相关信息。
    • 变量指的是系统提示词中要使用的变量(键)。{knowledge} 是一个保留变量。点击添加为系统提示词添加更多变量。
      • 如果您不确定变量背后的逻辑,请保持原样
      • 自 v0.20.0 起,如果您在此处添加自定义变量,唯一传入其值的方法是调用
  4. 更新模型设置

    • 模型中:您选择聊天模型。虽然您已在系统模型设置中选择了默认聊天模型,但 RAGFlow 允许您为对话选择一个备用聊天模型。
    • 自由度温度Top P存在惩罚频率惩罚设置的快捷方式,表示模型的自由度级别。从自由发挥精准平衡,每个预设配置都对应一个独特的温度Top P存在惩罚频率惩罚组合。
      此参数有三个选项
      • 自由发挥:产生更具创造性的回应。
      • 精准:(默认)产生更保守的回应。
      • 平衡:介于自由发挥精准之间。
    • 温度:模型输出的随机性水平。
      默认为 0.1。
      • 值越低,输出越具确定性和可预测性。
      • 值越高,输出越具创造性和多样性。
      • 温度为零时,对于相同的提示会产生相同的输出。
    • Top P:核心采样。
      • 通过设置一个阈值 P,将采样限制在累积概率超过 P 的词元范围内,从而降低生成重复或不自然文本的可能性。
      • 默认为 0.3。
    • 存在惩罚:鼓励模型在回应中包含更多样化的词元。
      • 较高的存在惩罚值会使模型更倾向于生成尚未包含在已生成文本中的词元。
      • 默认为 0.4。
    • 频率惩罚:阻止模型在生成的文本中过于频繁地重复相同的词语或短语。
      • 较高的频率惩罚值会使模型在使用重复词元方面更加保守。
      • 默认为 0.7。
  5. 现在,让我们开始表演吧

    question1

注意
  1. 点击答案上方的灯泡图标,查看展开的系统提示词

灯泡图标仅对当前对话有效。

  1. 向下滚动展开的提示词,查看每个任务所消耗的时间

enlighten

更新现有聊天助手的设置

将鼠标悬停在目标聊天助手上 > 编辑,以显示聊天配置对话框

edit_chat

chat_config

将聊天功能集成到您的应用程序或网页中

RAGFlow 提供 HTTP 和 Python API,供您将 RAGFlow 的功能集成到您的应用程序中。阅读以下文档以获取更多信息

您可以使用 iframe 将创建的聊天助手嵌入到第三方网页中

  1. 在继续之前,您必须获取一个 API 密钥;否则,将出现错误消息。

  2. 将鼠标悬停在目标聊天助手上 > 编辑,以显示 iframe 窗口

    chat-embed

  3. 复制 iframe 并将其嵌入到您网页的特定位置。