跳到主要内容
版本: DEV

开始AI聊天

使用已配置的聊天助手启动由AI驱动的聊天。


知识库、无幻觉聊天和文件管理是 RAGFlow 的三大支柱。RAGFlow 中的聊天基于特定的知识库或多个知识库。创建知识库、完成文件解析并运行检索测试后,您就可以开始一次 AI 对话了。

开始AI聊天

您可以通过创建助手来开始AI对话。

  1. 点击页面顶部中间的聊天选项卡 > 创建助手,以显示您下一个对话的聊天配置对话框。

    RAGFlow 允许您灵活地为每个对话选择不同的聊天模型,同时您可以在系统模型设置中设置默认模型。

  2. 更新助手设置

    • 助手名称是您的聊天助手的名称。每个助手对应一个对话,该对话具有知识库、提示、混合搜索配置和大型模型设置的独特组合。
    • 空回复:
      • 如果您希望将 RAGFlow 的答案限制在您的知识库中,请在此处填写回复。然后,当它无法检索到答案时,它会统一回复您在此设置的内容。
      • 如果您希望 RAGFlow 在无法从您的知识库中检索到答案时进行即兴发挥,请将其留空,这可能会导致幻觉。
    • 显示引用:这是 RAGFlow 的一个关键功能,默认启用。RAGFlow 不像黑箱一样工作。相反,它清楚地显示了其回复所基于的信息来源。
    • 选择相应的知识库。您可以选择一个或多个知识库,但请确保它们使用相同的嵌入模型,否则会发生错误。
  3. 更新提示引擎

    • 系统中,您可以填写您的 LLM 的提示,您也可以暂时保留默认提示不变。
    • 相似度阈值为每个文本块设置相似度“条”。默认值为 0.2。相似度得分较低的文本块将从最终回复中过滤掉。
    • 关键词相似度权重默认为 0.7。RAGFlow 使用混合评分系统来评估不同文本块的相关性。此值设置了在混合评分中分配给关键词相似度分量的权重。
      • 如果重排模型留空,混合评分系统将使用关键词相似度和向量相似度,分配给向量相似度分量的默认权重为 1-0.7=0.3。
      • 如果选择了重排模型,混合评分系统将使用关键词相似度和重排器得分,分配给重排器得分的默认权重为 1-0.7=0.3。
    • Top N 决定了馈送给 LLM 的文本块的最大数量。换句话说,即使检索到更多文本块,也只有 Top N 个文本块被作为输入提供。
    • 多轮优化通过在多轮对话中使用现有上下文来增强用户查询。它默认启用。启用后,它将消耗额外的 LLM token 并显著增加生成答案的时间。
    • 使用知识图谱表示在检索过程中是否使用指定知识库中的知识图谱进行多跳问答。启用后,这将涉及跨实体、关系和社区报告文本块的迭代搜索,从而大大增加检索时间。
    • 推理表示是否通过像 Deepseek-R1/OpenAI o1 这样的推理过程生成答案。启用后,聊天模型在遇到未知主题时会自动集成深度研究进行问答。这涉及聊天模型动态搜索外部知识并通过推理生成最终答案。
    • 重排模型设置要使用的重排模型。默认留空。
      • 如果重排模型留空,混合评分系统将使用关键词相似度和向量相似度,分配给向量相似度分量的默认权重为 1-0.7=0.3。
      • 如果选择了重排模型,混合评分系统将使用关键词相似度和重排器得分,分配给重排器得分的默认权重为 1-0.7=0.3。
    • 变量指将在系统提示中使用的变量(键)。{knowledge} 是一个保留变量。点击添加以添加更多用于系统提示的变量。
      • 如果您不确定变量背后的逻辑,请将其保持原样
      • 截至 v0.18.0,如果您在此处添加自定义变量,传递其值的唯一方法是调用
  4. 更新模型设置

    • 模型中:您选择聊天模型。虽然您已经在系统模型设置中选择了默认聊天模型,RAGFlow 仍允许您为您的对话选择备用聊天模型。
    • 自由度温度Top P存在惩罚频率惩罚设置的快捷方式,表示模型的自由度。从即兴发挥精确平衡,每个预设配置都对应着温度Top P存在惩罚频率惩罚的独特组合。
      此参数有三个选项
      • 即兴发挥:产生更具创造性的回复。
      • 精确:(默认)产生更保守的回复。
      • 平衡:介于即兴发挥精确之间的中间地带。
    • 温度:模型输出的随机性水平。
      默认值为 0.1。
      • 较低的值会导致更确定和可预测的输出。
      • 较高的值会导致更具创造性和多样化的输出。
      • 温度为零会导致相同的提示产生相同的输出。
    • Top P:核采样。
      • 通过设置阈值 P 并将采样限制在累积概率超过 P 的 token 上,降低生成重复或不自然文本的可能性。
      • 默认值为 0.3。
    • 存在惩罚:鼓励模型在回复中包含更多样化的 token。
      • 较高的存在惩罚值会导致模型更有可能生成尚未包含在生成文本中的 token。
      • 默认值为 0.4。
    • 频率惩罚:阻止模型在生成文本中过于频繁地重复相同的词语或短语。
      • 较高的频率惩罚值会导致模型在使用重复 token 时更加保守。
      • 默认值为 0.7。
  5. 现在,让我们开始吧

    question1

注意
  1. 点击答案上方的灯泡图标可查看展开的系统提示

灯泡图标仅对当前对话可用。

  1. 向下滚动展开的提示可查看每个任务消耗的时间

enlighten

更新现有聊天助手的设置

将鼠标悬停在目标聊天助手上 > 编辑,以显示聊天配置对话框

edit_chat

chat_config

将聊天功能集成到您的应用程序或网页中

RAGFlow 提供 HTTP 和 Python API,供您将 RAGFlow 的功能集成到您的应用程序中。阅读以下文档了解更多信息

您可以使用 iframe 将创建的聊天助手嵌入到第三方网页中

  1. 在继续之前,您必须获取 API 密钥;否则,将出现错误消息。

  2. 将鼠标悬停在目标聊天助手上 > 编辑,以显示 iframe 窗口

    chat-embed

  3. 复制 iframe 并将其嵌入到您网页上的特定位置。