更新日志
最新版本中的主要功能、改进和 Bug 修复。
v0.25.0
发布于 2026 年 4 月 21 日。
新功能
- Agent
- 引入了 7 个预置的数据摄入流水线模板。
- 智能体(Agent)应用现可发布。
- 支持沙箱代码执行和图表生成。
- 新增一个初学者数据分析智能体模板。
- 记忆:支持用户级别的记忆存储和检索。
- 新增 UI 语言:阿拉伯语(实现了从右到左的布局)、保加利亚语和土耳其语。
- 生态系统集成:RAGFlow 数据集现可通过 OpenClaw 访问。
改进
- 优化了 Docx 解析功能,支持图片懒加载,降低了内存占用。
- 优化了聊天、智能体和搜索嵌入式对话页面,提升了移动端兼容性。
- 底层系统与基础设施优化
- 将 RAGFlow 的文档引擎 Elasticsearch 升级至 9.x 版本。
- 由于官方 MinIO 镜像被弃用,默认对象存储容器切换为
pgsty/minio。 - 添加了数据库迁移脚本;详情请参阅 此自述文件。
模型支持
- MiniMax-M2.7 系列
- Perplexity 嵌入模型 (pplx-embed)
- 通义重排序模型 (Tongyi rerank)
新模型供应商
- avian.io
- ragcon.ai
数据源
- Seafile
- RSS
- 钉钉 AI 表格 (DingTalk AI Table)
- GitHub:支持同步已删除的文件。
- Agent
v0.24.0
发布于 2026 年 2 月 10 日。
新功能
- 知识库
- 引入了记忆管理 API(HTTP 和 Python)。
- 将记忆提取日志输出到控制台。
- 数据集
- 支持批量元数据管理。
- 将“目录 (ToC)”重命名为“页面索引 (PageIndex)”。详情请见 此处。
- Agent
- 推出全新的类似聊天的智能体对话管理界面,可保留会话和对话历史。
- 引入多沙箱机制,支持本地 gVisor 和阿里云,并兼容主流沙箱 API(可在管理页面配置)。
- 对话
- 新增“思考”模式,并移除之前的“推理”配置选项。
- 优化深度研究场景下的检索策略,提高召回准确率。
- 管理
- 支持多个管理员账号。
- 模型配置中心
- 为新模型添加了模型连接测试。
MySQL 替代方案
- 支持使用 OceanBase 作为 MySQL 的替代方案。
模型支持
- Kimi 2.5
- Stepfun 3
- doubao-embedding-vision
- PaddleOCR-VL
数据源
- Zendesk
- Bitbucket
API 变更
HTTP API
Python API
- 知识库
v0.23.0
发布于 2025 年 12 月 27 日。
新功能
- 知识库
- 实现用于管理记忆的记忆 (Memory) 接口。
- 支持通过检索 (Retrieval) 或消息 (Message) 组件配置上下文。
- Agent
- 通过重构底层架构,提升了智能体 (Agent) 组件的性能。
- 智能体组件现在可以输出结构化数据,供下游组件使用。
- 支持使用 Webhook 触发智能体执行。
- 支持语音输入/输出。
- 支持每个智能体组件配置多个检索组件。
- 摄入流水线
- 在转换器 (Transformer) 组件中支持提取目录,以改善长上下文 RAG 性能。
- 数据集
- 支持为图片和表格配置上下文窗口。
- 引入父子块(Parent-child)分块策略。
- 支持在文件解析过程中自动生成元数据。
- 聊天:支持语音输入。
改进
- RAG:显著加速了 GraphRAG 生成。
- 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.15(向后兼容)。
数据源
- Google Cloud Storage
- Gmail
- Dropbox
- WebDAV
- Airtable
模型支持
- GPT-5.2
- GPT-5.2 Pro
- GPT-5.1
- GPT-5.1 Instant
- Claude Opus 4.5
- MiniMax M2
- GLM-4.7
- MinerU 配置界面。
- AI Badgr (模型供应商)。
API 变更
HTTP API
- 知识库
v0.22.1
发布于 2025 年 11 月 19 日。
改进
- Agent
- 支持将智能体输出导出为 Word 或 Markdown 格式。
- 添加列表操作 (List operations) 组件。
- 添加变量聚合器 (Variable aggregator) 组件。
- 数据源
- 支持 S3 兼容数据源,例如 MinIO。
- 添加与 JIRA 的数据同步功能。
- 继续对个人资料 (Profile) 页面布局进行重新设计。
- 将 Flask Web 框架从同步升级为异步,提升了并发性并防止了在请求上游 LLM 服务时造成的阻塞问题。
已修复的问题
- v0.22.0 问题:用户无法解析上传的文件,或无法在使用内置模型的
-fullRAGFlow 版本的数据集中切换嵌入模型。 - Word 文档中的图像连接问题。 #11310
- 混合图文在聊天历史中无法正确显示。
新支持的模型
- Gemini 3 Pro Preview
- Agent
v0.22.0
发布于 2025 年 11 月 12 日。
重大变更
重要提示从本版本开始,我们仅发布精简版(不含嵌入模型)Docker 镜像,不再在镜像标签中添加
-slim后缀。新功能
- 数据集
- 支持从五个在线来源(AWS S3、Google Drive、Notion、Confluence 和 Discord)进行数据同步。
- RAPTOR 可针对整个数据集或单个文档构建。
- 摄入流水线:在解析器 (Parser) 组件中支持 Docling 文档解析。
- 推出全新的管理 Web UI 仪表板,用于图形化用户管理和服务状态监控。
- Agent
- 支持结构化输出。
- 在检索组件中支持元数据过滤。
- 引入具有数据操作和会话变量定义功能的变量聚合器组件。
改进
- 智能体:支持在等待响应 (Await Response) 组件中可视化之前组件的输出。
- 重构模型提供商页面。
- 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.5。
新增模型
- Kimi-K2-Thinking
新智能体模板
- 交互式智能体:结合实时用户反馈来动态优化智能体输出。
- 数据集
v0.21.0
发布于 2025 年 10 月 15 日。
新功能
- 可编排摄入流水线:支持自定义数据摄入和清洗工作流,使用户能够灵活设计数据流或直接在画布上应用官方数据流模板。
- 优化 GraphRAG 和 RAPTOR 写入过程:将自动增量构建过程替换为手动批量构建,显著减少了构建开销。
- 长上下文 RAG:自动生成文档级目录 (TOC) 结构,以减轻因分块不准确或过多导致的上下文丢失,显著提高检索质量。该功能现可通过目录提取模板使用。详情请见 此处。
- 视频文件解析:通过支持视频文件解析,扩展了系统的多模态数据处理能力。
- 管理 CLI:引入全新的系统管理命令行工具,允许用户通过命令行管理和监控 RAGFlow 服务状态。
改进
- 重新设计了 RAGFlow 的登录和注册页面。
- 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.0。
新支持的模型
- 通义千问 3 系列
- Claude Sonnet 4.5
- 美团 LongCat-Flash-Thinking
新智能体模板
- 企业研究报告深度分析智能体:专为金融机构设计,帮助分析师快速整理信息、生成研究报告并辅助投资决策。
- 可编排摄入流水线模板:允许用户在画布上应用此模板,快速建立标准化的数据摄入和清洗流程。
v0.20.5
发布于 2025 年 9 月 10 日。
改进
- Agent
- 聊天:重新启用推理和跨语言搜索。
新支持的模型
- 美团 LongCat
- Kimi:kimi-k2-turbo-preview 和 kimi-k2-0905-preview
- 通义千问:qwen3-max-preview
- SiliconFlow:DeepSeek V3.1
已修复的问题
- 数据集:已删除的文件仍然可以搜索到。
- 聊天:无法与 Ollama 模型对话。
- Agent
- 引用切换开关失效。
- 任务模式下的智能体仍然需要对话来触发。
- 多轮对话中回答重复。
- 并行执行结果的重复总结。
API 变更
HTTP API
Python API
v0.20.4
发布于 2025 年 8 月 27 日。
改进
- 智能体组件:完成了智能体组件的中文本地化。
- 引入
ENABLE_TIMEOUT_ASSERTION环境变量,用于启用或禁用文件解析任务的超时断言。 - 数据集
- 改进 Markdown 文件解析,支持 AST 以避免意外分块。
- 增强 HTML 解析,支持基于 bs4 的 HTML 标签遍历。
新支持的模型
智谱 GLM-4.5
新智能体模板
电商客服工作流:专为处理产品功能查询、内部数据集内多产品对比以及管理安装预约需求而设计的模板。
已修复的问题
- 数据集
- 无法与团队共享资源。
- 对上传文件的数量和大小存在不合理的限制。
- 对话
- 无法预览响应中引用的文件。
- 文件上传后无法发送消息。
- OAuth2 认证失败。
- 数据集内多条件元数据搜索的逻辑错误。
- 多轮对话中引用无限增加。
v0.20.3
发布于 2025 年 8 月 20 日。
改进
- 重构了数据集、聊天和搜索页面的用户界面。
- 搜索和聊天:引入文档级元数据过滤,允许在聊天或搜索过程中自动或手动过滤。
- 搜索:支持为不同业务场景创建搜索应用。
- 聊天:支持在单个聊天页面中对比最多三个聊天模型设置的回答效果。
- Agent
- 在智能体组件中实现启用或禁用引用的切换开关。
- 引入用于创建组件的拖拽方法。
- 文档:修正了 API 参考中的不准确之处。
新智能体模板
- 报告智能体:用于内部问答场景下生成总结报告的模板,支持显示表格和公式。 #9427
已修复的问题
- v0.20.0 中引入的超时机制导致 GraphRAG 等任务中断。
- 对话过程中缺失智能体组件中预定义的开场问候语。
- 提示词编辑器中的自动换行问题。
- 由 PyPDF 引起的内存泄漏问题。 #9469
API 变更
已弃用
v0.20.0
发布于 2025 年 8 月 4 日。
兼容性变更
从 v0.20.0 开始,智能体与早期版本不再兼容,所有从之前版本迁移而来的现有智能体必须在升级后重建。
新功能
- Agent 和工作流的统一编排。
- 对智能体进行了全面重构,大大增强了其能力和可用性,支持多智能体配置、规划与反思以及可视化功能。
- 完全实现 MCP 功能,允许导入 MCP 服务器、智能体作为 MCP 客户端运行,以及 RAGFlow 本身作为 MCP 服务器运行。
- 可访问 Agent 的运行时日志。
- 可以通过管理面板访问与智能体的聊天历史记录。
- 集成了更强大的 Infinity 版本,支持以 Infinity 作为底层文档引擎的自动标签功能。
- 支持文件引用信息的 OpenAI 兼容 API。
- 支持新模型,包括 Kimi K2、Grok 4 和 Voyage embedding。
- RAGFlow 的代码库现已镜像至 Gitee。
- 引入新的模型提供商:Gitee AI。
引入新智能体模板
- 基于多智能体的深度研究:由引导智能体 (Lead Agent) 领导的协作式智能体团队,区别于传统的工作流编排。
- 利用内部数据集的智能问答聊天机器人,专为客服和培训场景设计。
- RAGFlow 团队使用的简历分析模板,用于筛选、分析和记录候选人信息。
- 将原始创意转化为 SEO 友好型博客内容的博客生成工作流。
- 智能客服工作流。
- 通过语义分析将用户反馈导向相应团队的用户反馈分析模板。
- 行程规划:使用网页搜索和地图 MCP 服务器辅助行程规划。
- 图片文字翻译:翻译上传照片中的内容。
- 从内部数据集和网络中检索答案的信息搜索助手。
v0.19.0
发布于 2025 年 5 月 26 日。
新功能
- 跨语言搜索现已在知识库和聊天模块中得到支持,增强了在中英数据集等多语言环境下的搜索准确性和用户体验。
- 智能体组件:新增代码组件,支持 Python 和 JavaScript 脚本,使开发者能够处理更复杂的任务(如动态数据处理)。
- 增强图像显示:聊天和搜索中的图像现在直接在响应中渲染,而不是作为外部引用。知识库检索测试现在可以直接检索图像,而非提取图像中的文本。
- Claude 4 和 ChatGPT o3:开发者现在可以使用最新发布的顶级 Claude 模型以及 OpenAI 最新的 ChatGPT o3 推理模型。
以下功能由社区贡献
- 智能体组件:在生成组件中启用工具调用。感谢 notsyncing。
- Markdown 渲染:Markdown 文件中的图像引用在分块后可以正常显示。感谢 Woody-Hu。
- 文档引擎支持:OpenSearch 现可用作 RAGFlow 的文档引擎。感谢 pyyuhao。
文档
新增文档
v0.18.0
发布于 2025 年 4 月 23 日。
兼容性变更
从本版本开始,移除了内置重排序模型,因为它们对检索率的影响微乎其微,但却显著增加了检索时间。
新功能
- MCP 服务器:支持通过 MCP 访问 RAGFlow 的数据集。
- DeepDoc 支持在文档布局识别过程中采用 VLM 模型作为处理流水线,实现对 PDF 和 DOCX 文件中图像的深入分析。
- OpenAI 兼容 API:智能体可以通过 OpenAI 兼容的 API 进行调用。
- 用户注册控制:管理员可以通过环境变量启用或禁用用户注册。
- 团队协作:智能体可以与团队成员共享。
- 智能体版本控制:所有更新都会持续记录,并通过导出功能回滚到之前的版本。

改进
- 增强回答引用:提高了生成响应中引用的准确性。
- 增强问答体验:用户现在可以在对话过程中手动停止流式输出。
文档
新增文档
v0.17.2
发布于 2025 年 3 月 13 日。
兼容性变更
- 从聊天配置中移除 Max_tokens 设置。
- 从生成、重写、分类、关键词智能体组件中移除 Max_tokens 设置。
从本版本开始,如果发现 RAGFlow 的响应被截断,请检查模型提供商的 Max_tokens 设置。
改进
- 添加 OpenAI 兼容 API。
- 引入德语用户界面。
- 加速知识图谱提取。
- 在检索智能体组件中启用基于 Tavily 的网页搜索。
- 添加通义千问 QwQ 模型(OpenAI 兼容)。
- 在通用分块方法中支持 CSV 文件。
已修复的问题
- 无法通过 Ollama/Xinference 添加模型,这是 v0.17.1 中引入的一个问题。
API 变更
HTTP API
Python API
v0.17.0
发布于 2025 年 3 月 3 日。
新功能
- AI 聊天:为智能体推理实现了深度研究 (Deep research)。如需启用,请在聊天助手的提示词引擎选项卡下开启推理切换开关。
- AI 聊天:利用基于 Tavily 的网页搜索增强智能体推理的上下文。如需启用,请在聊天助手的助手设置选项卡下输入正确的 Tavily API Key。
- AI 聊天:支持在不指定数据集的情况下开始聊天。
- AI 聊天:除 PDF 文件外,HTML 文件现在也可进行预览和引用。
- 数据集:在数据集配置中添加PDF 解析器(即文档解析器)下拉菜单。包括耗时的 DeepDoc 模型选项、跳过 DLA(文档布局分析)、OCR(光学字符识别)和 TSR(表格结构识别)任务的快速 naive(纯文本)选项,以及多个当前处于实验性的大模型选项。详情请见 此处。
- 智能体组件:可以使用 (x) 或正斜杠
/在生成或模板组件的系统提示词字段中插入可用键(变量)。 - 对象存储:支持使用阿里云 OSS(对象存储服务)作为文件存储选项。
- 模型:更新通义千问 (Qwen) 的支持模型列表,添加特定于 DeepSeek 的模型;添加 ModelScope 作为模型提供商。
- API:文档元数据可以通过 API 进行更新。
下图展示了 RAGFlow 深度研究的工作流
下图展示了集成了深度研究的对话截图
API 变更
HTTP API
为更新文档方法添加主体参数
"meta_fields"。Python API
为更新文档方法添加键选项
"meta_fields"。文档
新增文档
v0.16.0
发布于 2025 年 2 月 6 日。
新功能
- 支持 DeepSeek R1 和 DeepSeek V3。
- GraphRAG 重构:知识图谱现在是在整个数据集而非单个文件上动态构建,并在新上传的文件开始解析时自动更新。详情请见 此处。
- 添加迭代 (Iteration) 智能体组件和研究报告生成器智能体模板。详情请见 此处。
- 新增 UI 语言:葡萄牙语。
- 允许为数据集中的特定文件设置元数据,以增强 AI 对话能力。详情请见 此处。
- 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.0.dev3。
- 支持 DeepDoc 的 GPU 加速(请参阅 docker-compose-gpu.yml)。
- 支持创建和引用标签 (Tag) 数据集,作为缩小查询与响应之间语义鸿沟的关键里程碑。
重要提示标签数据集功能在 Infinity 文档引擎上不可用。
文档
新增文档
v0.15.0
发布于 2024 年 12 月 18 日。
新功能
- 引入额外的智能体特定 API。
- 支持使用 Page Rank 分数来提升跨多个数据集搜索时的检索性能。
- 在聊天和智能体中提供 iframe,以促进 RAGFlow 集成到您的网页中。
- 添加用于在 Kubernetes 上部署 RAGFlow 的 Helm Chart。
- 支持以 JSON 格式导入或导出智能体。
- 支持智能体组件/工具的单步运行。
- 新增 UI 语言:日语。
- 支持从失败中恢复 GraphRAG 和 RAPTOR,增强任务管理的弹性。
- 添加更多 Mistral 模型。
- 为 UI 添加深色模式,允许用户在浅色和深色主题之间切换。
改进
- 升级 DeepDoc 中的文档布局分析模型。
- 在使用 Infinity 作为文档引擎时,显著增强了检索性能。
API 变更
HTTP API
Python API
v0.14.1
发布于 2024 年 11 月 29 日。
改进
添加 Infinity 配置文件 以促进 Infinity 作为文档引擎的集成与定制。从本版本开始,可以直接在 RAGFlow 内修改 Infinity 的配置,并在使用
docker compose重启 RAGFlow 后立即生效。 #3715已修复的问题
本版本修复了以下问题
- 无法显示或编辑点击后的分块内容。
- Elasticsearch 中的
'Not found'错误。 - 中文文本在解析过程中乱码。
- Polars 兼容性问题。
- Infinity 与 GraphRAG 之间的兼容性问题。
v0.14.0
发布于 2024 年 11 月 26 日。
新功能
- 支持 Infinity 或 Elasticsearch(默认)作为文档引擎进行向量存储和全文索引。 #2894
- 通过在智能体中添加更多变量并实现自动保存,提升了用户体验。
- 添加受 Andrew Ng 的翻译智能体 启发的“三步翻译智能体”模板。
- 添加 SEO 优化博客写作智能体模板。
- 提供与智能体对话的 HTTP 和 Python API。
- 支持在检索过程中使用英语同义词。
- 优化术语权重计算,将检索时间缩短了 50%。
- 通过附加性能指标改善任务执行器监控。
- 用 Valkey 替换 Redis。
- 添加三种新的 UI 语言(社区贡献):印度尼西亚语、西班牙语和越南语。
兼容性变更
从本版本开始,service_config.yaml.template 取代 service_config.yaml 用于配置后端服务。Docker 容器启动时,会自动填充此模板文件中定义的环境变量,并从中自动生成 service_config.yaml。 #3341
这种方法无需在更改 .env 后手动更新 service_config.yaml,有助于实现动态环境配置。
重要提示在尝试此新方法之前,请确保您 同时升级代码和 Docker 镜像至此版本。
API 变更
HTTP API
Python API
文档
新增文档
v0.12.0
发布于 2024 年 9 月 30 日。
新特性
- 提供 RAGFlow Docker 镜像的精简版(slim),其中不包含内置的 BGE/BCE 嵌入或重排序模型。
- 改进了多轮对话的效果。
- 支持用户移除已添加的 LLM 供应商。
- 增加对 OpenTTS 和 SparkTTS 模型的支持。
- 在通用(General)分块方法中实现了 Excel 转 HTML 开关,允许用户将电子表格解析为 HTML 表格或按行解析为键值对。
- 添加了智能体工具 YahooFinance 和 Jin10。
- 添加了一个投资顾问智能体模板。
兼容性变更
从本版本开始,RAGFlow 提供 Docker 镜像的精简版,以改善网络受限用户的体验。RAGFlow Docker 精简版镜像不包含内置的 BGE/BCE 嵌入模型,大小约为 1GB;完整版 RAGFlow 镜像约为 9GB,并包含两个内置的嵌入模型。
默认的 Docker 镜像版本为
nightly-slim。以下列表阐明了各版本之间的差异:nightly-slim:最新测试 Docker 镜像的精简版。v0.12.0-slim:最新正式发布 Docker 镜像的精简版。nightly:最新测试 Docker 镜像的完整版。v0.12.0:最新正式发布 Docker 镜像的完整版。
有关升级说明,请参阅 升级 RAGFlow。
文档
新增文档
v0.11.0
发布于 2024 年 9 月 14 日。
新特性
- 在 RAGFlow UI 中引入了 AI 搜索界面。
- 支持通过 FishAudio 或 通义千问 TTS 进行音频输出。
- 除了 MySQL 之外,允许使用 Postgres 进行元数据存储。
- 支持使用 S3 或 Azure Blob 进行对象存储。
- 支持模型供应商:Anthropic、Voyage AI 和 Google Cloud。
- 支持使用 腾讯云 ASR 进行音频内容识别。
- 添加了金融类智能体组件:问财(WenCai)、AkShare、YahooFinance 和 TuShare。
- 添加了一个医疗顾问智能体模板。
- 支持在以下数据集上运行检索基准测试:
v0.7.0
发布于 2024 年 5 月 31 日。
新特性
- 支持使用重排序(Reranker)模型。
- 集成了重排序和嵌入模型:BCE、BGE 和 Jina。
- 支持百川(Baichuan)和火山引擎(VolcanoArk)LLM。
- 实现了 RAPTOR 以改善文本检索效果。
- 在通用(GENERAL)分块方法中支持 HTML 文件。
- 提供用于按 ID 删除文档的 HTTP 和 Python API。
- 支持 ARM64 平台。
重要提示虽然我们在 ARM64 平台上测试 RAGFlow,但我们不维护 ARM 版本的 RAGFlow Docker 镜像。
如果您使用的是 ARM 平台,请遵循本指南构建 RAGFlow Docker 镜像。
API 变更
HTTP API
Python API