跳至主要内容
版本:DEV

发布版本

最新发布版本中的主要功能、改进和错误修复。

信息

每个 RAGFlow 发布版本都有两个版本

  • Slim 版:不包含内置的嵌入模型,版本名称带有 -slim 后缀。示例:infiniflow/ragflow:v0.18.0-slim
  • 完整版:包含内置的嵌入模型,版本名称不带后缀。示例:infiniflow/ragflow:v0.18.0

v0.18.0

发布于 2025 年 4 月 23 日。

兼容性变更

从该版本开始,内置的 rerank 模型已被移除,因为它们对检索率的影响微乎其微,但显著增加了检索时间。

新功能

  • MCP 服务器:通过 MCP 访问 RAGFlow 的知识库。
  • DeepDoc 支持在文档布局识别过程中采用 VLM 模型作为处理管道,从而实现对 PDF 和 DOCX 文件中图像的深度分析。
  • OpenAI 兼容 API:Agent 可以通过 OpenAI 兼容 API 调用。
  • 用户注册控制:管理员可以通过环境变量启用或禁用用户注册。
  • 团队协作:Agent 可以与团队成员共享。
  • Agent 版本控制:所有更新都会持续记录,并且可以通过导出回滚到之前的版本。

export_agent

改进

  • 增强的答案引用:提高了生成回答中的引用准确性。
  • 增强的问答体验:用户现在可以在对话期间手动停止流式输出。

文档

新增文档

v0.17.2

发布于 2025 年 3 月 13 日。

兼容性变更

  • 聊天配置中移除 Max_tokens 设置。
  • GenerateRewriteCategorizeKeyword Agent 组件中移除 Max_tokens 设置。

从该版本开始,如果您仍然看到 RAGFlow 的响应被截断或缩短,请检查您的模型提供商的 Max_tokens 设置。

改进

  • 新增 OpenAI 兼容 API。
  • 引入德语用户界面。
  • 加速知识图谱提取。
  • 检索 Agent 组件中启用基于 Tavily 的网页搜索。
  • 新增通义千问 QwQ 模型(OpenAI 兼容)。
  • 通用分块方法中支持 CSV 文件。

修复的问题

  • 无法通过 Ollama/Xinference 添加模型,这是 v0.17.1 中引入的问题。

HTTP API

Python API

v0.17.1

发布于 2025 年 3 月 11 日。

改进

  • 提高了英文分词质量。
  • 改进了 Markdown 文档解析中的表格提取逻辑。
  • 更新 SiliconFlow 的模型列表。
  • 支持解析 XLS 文件(Excel 97-2003)并改进了相应的错误处理。
  • 支持 Huggingface rerank 模型。
  • 在聊天助手和重写 Agent 组件中启用相对时间表达(“现在”、“昨天”、“上周”、“明年”等)。

修复的问题

  • 一个重复的知识图谱提取问题。
  • API 调用问题。
  • PDF 解析器(也称为文档解析器)下拉菜单中的选项缺失。
  • 一个 Tavily 网页搜索问题。
  • 无法在 AI 聊天中预览图表或图像。

文档

新增文档

v0.17.0

发布于 2025 年 3 月 3 日。

新功能

  • AI 聊天:实现 Agentic Reasoning 的深度研究。要激活此功能,请在聊天助手对话框的提示引擎选项卡下启用推理开关。
  • AI 聊天:利用基于 Tavily 的网页搜索增强 Agentic Reasoning 中的上下文。要激活此功能,请在聊天助手对话框的助手设置选项卡下输入正确的 Tavily API 密钥。
  • AI 聊天:支持不指定知识库开始聊天。
  • AI 聊天:除了 PDF 文件外,HTML 文件也可以预览和引用。
  • 数据集:在数据集配置中新增一个PDF 解析器(也称为文档解析器)下拉菜单。其中包括 DeepDoc 模型选项(耗时较长),一个快得多的朴素选项(纯文本),它跳过 DLA(文档布局分析)、OCR(光学字符识别)和 TSR(表格结构识别)任务,以及几个目前处于实验阶段的大模型选项。
  • Agent 组件:在 GenerateTemplate 组件的系统提示字段中可以使用 (x) 或斜杠 / 来插入可用的键(变量)。
  • 对象存储:支持使用阿里云 OSS(对象存储服务)作为文件存储选项。
  • 模型:更新了通义千问(Qwen)支持的模型列表,新增了 DeepSeek 特定模型;新增 ModelScope 作为模型提供商。
  • API:可以通过 API 更新文档元数据。

下图说明了 RAGFlow 深度研究的工作流程

Image

下图是集成深度研究的对话截图

Image

HTTP API

更新文档方法新增一个 body 参数 "meta_fields"

Python API

更新文档方法新增一个键选项 "meta_fields"

文档

新增文档

v0.16.0

发布于 2025 年 2 月 6 日。

新功能

  • 支持 DeepSeek R1 和 DeepSeek V3。
  • GraphRAG 重构:知识图谱在整个知识库(数据集)上动态构建,而不是基于单个文件,并在新上传的文件开始解析时自动更新。请参见此处
  • 新增一个迭代 Agent 组件和一个研究报告生成器 Agent 模板。请参见此处
  • 新的用户界面语言:葡萄牙语。
  • 允许在知识库中为特定文件设置元数据,以增强 AI 驱动的聊天。请参见此处
  • 将 RAGFlow 的文档引擎 Infinity 升级到 v0.6.0.dev3。
  • 支持 DeepDoc 的 GPU 加速(参见 docker-compose-gpu.yml)。
  • 支持创建和引用标签知识库,这是弥合查询与响应之间语义鸿沟的关键里程碑。
重要

标签知识库功能在 Infinity 文档引擎上不可用

文档

新增文档

v0.15.1

发布于 2024 年 12 月 25 日。

升级

  • 将 RAGFlow 的文档引擎 Infinity 升级到 v0.5.2。
  • 增强了文档解析状态的日志显示。

修复的问题

此版本修复了以下问题

  • Infinity 返回的 SCORE not foundposition_int 错误。
  • 一旦更改了特定知识库中的嵌入模型,其他知识库中的嵌入模型就无法再更改。
  • 由于重复加载嵌入模型,问答和 AI 搜索响应缓慢。
  • 无法使用 RAPTOR 解析文档。
  • 使用表格解析方法导致信息丢失。
  • 杂项 API 问题。

HTTP API

为以下 API 新增一个可选参数 "user_id"

v0.15.0

发布于 2024 年 12 月 18 日。

新功能

  • 引入额外的 Agent 特定 API。
  • 支持使用页面排名分数来提高跨多个知识库搜索时的检索性能。
  • 在聊天和 Agent 中提供 iframe,以便将 RAGFlow 集成到您的网页中。
  • 新增用于在 Kubernetes 上部署 RAGFlow 的 Helm Chart。
  • 支持以 JSON 格式导入或导出 Agent。
  • 支持 Agent 组件/工具的分步运行。
  • 新增一种用户界面语言:日语。
  • 支持从失败中恢复 GraphRAG 和 RAPTOR,增强任务管理弹性。
  • 新增更多 Mistral 模型。
  • 在用户界面中新增深色模式,允许用户在浅色和深色主题之间切换。

改进

  • 升级 DeepDoc 中的文档布局分析模型。
  • 在使用 Infinity 作为文档引擎时显著提高了检索性能。

HTTP API

Python API

v0.14.1

发布于 2024 年 11 月 29 日。

改进

新增 Infinity 的配置文件,以便集成和自定义 Infinity 作为文档引擎。从该版本开始,可以在 RAGFlow 中直接更新 Infinity 的配置,并在使用 docker compose 重启 RAGFlow 后立即生效。 #3715

修复的问题

此版本修复了以下问题

  • 点击分块后无法显示或编辑其内容。
  • Elasticsearch 中出现 'Not found' 错误。
  • 解析过程中出现中文乱码。
  • 与 Polars 的兼容性问题。
  • Infinity 和 GraphRAG 之间的兼容性问题。

v0.14.0

发布于 2024 年 11 月 26 日。

新功能

  • 支持将 Infinity 或 Elasticsearch(默认)用作矢量存储和全文索引的文档引擎。 #2894
  • 通过为 Agent 添加更多变量和实现自动保存来增强用户体验。
  • 新增一个三步翻译 Agent 模板,灵感来自 Andrew Ng 的翻译 Agent
  • 新增一个 SEO 优化的博客写作 Agent 模板。
  • 提供 HTTP 和 Python API 用于与 Agent 对话。
  • 支持在检索过程中使用英文同义词。
  • 优化术语权重计算,将检索时间减少 50%。
  • 通过附加性能指标改进任务执行器监控。
  • 将 Redis 替换为 Valkey。
  • 新增三种用户界面语言(社区贡献):印度尼西亚语、西班牙语和越南语。

兼容性变更

从该版本开始,service_config.yaml.template 替换 service_config.yaml 用于配置后端服务。在 Docker 容器启动时,此模板文件中定义的环境变量会自动填充,并从中自动生成一个 service_config.yaml 文件。 #3341

这种方法消除了在修改 .env 后手动更新 service_config.yaml 的需要,方便动态环境配置。

重要

在尝试此新方法之前,请确保您将您的代码 Docker 镜像都升级到此版本

HTTP API

Python API

文档

新增文档

v0.13.0

发布于 2024 年 10 月 31 日。

新功能

  • 为所有用户新增团队管理功能。
  • 更新 Agent 用户界面以提高可用性。
  • 通用分块方法中新增支持 Markdown 分块。
  • 在 Agent 用户界面中引入一个 invoke 工具。
  • 集成支持 Dify 的知识库 API。
  • 新增支持 GLM4-9B 和 Yi-Lightning 模型。
  • 引入用于数据集管理、数据集内文件管理和聊天助手管理的 HTTP 和 Python API。
注意

下载 RAGFlow 的 Python SDK

pip install ragflow-sdk==0.13.0

文档

新增文档

v0.12.0

发布于 2024 年 9 月 30 日。

新功能

  • 提供 RAGFlow Docker 镜像的 Slim 版,不包含内置的 BGE/BCE 嵌入或 reranking 模型。
  • 改进了多轮对话的结果。
  • 允许用户移除已添加的 LLM 供应商。
  • 新增支持 OpenTTSSparkTTS 模型。
  • 通用分块方法中实现一个Excel 到 HTML开关,允许用户将电子表格解析为 HTML 表格或按行解析为键值对。
  • 新增 Agent 工具 YahooFinanceJin10
  • 新增一个投资顾问 Agent 模板。

兼容性变更

从该版本开始,RAGFlow 提供其 Docker 镜像的 Slim 版,以改善互联网访问受限用户的体验。RAGFlow Docker 镜像的 Slim 版不包含内置的 BGE/BCE 嵌入模型,大小约为 1GB;RAGFlow 的完整版大小约为 9GB,包含内置的嵌入模型以及您在 RAGFlow 用户界面中选择后将下载的嵌入模型。

默认的 Docker 镜像版本是 nightly-slim。以下列表阐明了不同版本之间的差异

  • nightly-slim:最新测试 Docker 镜像的 Slim 版。
  • v0.12.0-slim:最新正式发布 Docker 镜像的 Slim 版。
  • nightly:最新测试 Docker 镜像的完整版。
  • v0.12.0:最新正式发布 Docker 镜像的完整版。

有关升级说明,请参见升级 RAGFlow

文档

新增文档

v0.11.0

发布于 2024 年 9 月 14 日。

新功能

  • 在 RAGFlow 用户界面中引入 AI 搜索界面。
  • 支持通过 FishAudio通义千问 TTS 输出音频。
  • 除 MySQL 外,还允许使用 Postgres 进行元数据存储。
  • 支持使用 S3 或 Azure Blob 的对象存储选项。
  • 支持模型供应商:AnthropicVoyage AIGoogle Cloud
  • 支持使用腾讯云 ASR 进行音频内容识别。
  • 新增金融领域特定的 Agent 组件:问财AkShareYahooFinanceTuShare
  • 新增一个医疗顾问 Agent 模板。
  • 支持在以下数据集上运行检索基准测试

v0.10.0

发布于 2024 年 8 月 26 日。

新功能

  • 在 Agent 用户界面中引入文本转 SQL 模板。
  • 实现 Agent API。
  • 集成任务执行器的监控功能。
  • 引入 Agent 工具 GitHubDeepL百度翻译和风天气Google Scholar
  • 支持 EML 文件分块。
  • 支持更多 LLM 或模型服务:GPT-4o-miniPerfXCloudTogetherAIUpstageNovita AI01.AISiliconFlowPPIO讯飞星火百度文言一心腾讯混元

v0.9.0

发布于 2024 年 8 月 6 日。

新功能

  • 支持将 GraphRAG 作为分块方法。
  • 引入 Agent 组件关键词和搜索工具,包括百度DuckDuckGoPubMed维基百科BingGoogle
  • 支持音频文件的语音转文本识别。
  • 支持模型供应商 GeminiGroq
  • 支持推理框架、引擎和服务,包括 LM studioOpenRouterLocalAINvidia API
  • 支持在 Xinference 中使用 reranker 模型。

v0.8.0

发布于 2024 年 7 月 8 日。

新功能

  • 支持 Agentic RAG,启用基于图谱的工作流构建,用于 RAG 和 Agent。
  • 支持模型供应商 MistralMiniMaxBedrockAzure OpenAI
  • 在 MANUAL 分块方法中支持 DOCX 文件。
  • 在问答分块方法中支持 DOCX、MD 和 PDF 文件。

v0.7.0

发布于 2024 年 5 月 31 日。

新功能

  • 支持使用 reranker 模型。
  • 集成 reranker 和嵌入模型:BCEBGEJina
  • 支持 LLM 百川和 火山方舟。
  • 实现 RAPTOR 以改进文本检索。
  • 在 GENERAL 分块方法中支持 HTML 文件。
  • 提供 HTTP 和 Python API,用于按 ID 删除文档。
  • 支持 ARM64 平台。
重要

虽然我们也在 ARM64 平台上测试 RAGFlow,但我们不维护适用于 ARM 的 RAGFlow Docker 镜像。

如果您使用 ARM 平台,请遵循本指南构建 RAGFlow Docker 镜像。

HTTP API

Python API

v0.6.0

发布于 2024 年 5 月 21 日。

新功能

  • 支持流式输出。
  • 提供 HTTP 和 Python API 用于检索文档分块。
  • 支持监控系统组件,包括 Elasticsearch、MySQL、Redis 和 MinIO。
  • 在 GENERAL 分块方法中支持禁用布局识别以减少文件分块时间。

HTTP API

Python API

v0.5.0

发布于 2024 年 5 月 8 日。

新功能

  • 支持 LLM DeepSeek。