跳转到主内容

发布版本

最新版本中的关键特性、改进和缺陷修复。

v0.23.0

发布于 2025 年 12 月 29 日。

新特性

  • 记忆 (Memory)
    • 实现了用于管理记忆的 Memory 接口。
    • 支持通过 检索 (Retrieval)消息 (Message) 组件配置上下文。
  • Agent
    • 通过重构底层架构提高了 智能体 (Agent) 组件的性能。
    • 智能体 (Agent) 组件现在可以输出结构化数据,供下游组件使用。
    • 支持使用 webhook 触发智能体执行。
    • 支持语音输入/输出。
    • 支持为每个 智能体 (Agent) 组件配置多个 检索 (Retrieval) 组件。
  • 数据摄入流水线
    • 支持在 Transformer 组件中提取目录,以提高长文本 RAG 性能。
  • 数据集
    • 支持为图像和表格配置上下文窗口。
    • 引入了父子分块策略。
    • 支持在文件解析过程中自动生成元数据。
  • 聊天:支持语音输入。

改进

  • 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.13(向后兼容)。

数据源

  • Google Cloud Storage
  • Gmail
  • Dropbox
  • WebDAV
  • Airtable

模型支持

  • GPT-5.2
  • GPT-5.2 Pro
  • GPT-5.1
  • GPT-5.1 Instant
  • Claude Opus 4.5
  • MiniMax M2
  • GLM-4.7。
  • MinerU 配置界面。
  • AI Badgr(模型供应商)。

API 变更

HTTP API

v0.22.1

发布于 2025 年 11 月 19 日。

改进

  • Agent
    • 支持以 Word 或 Markdown 格式导出智能体输出。
    • 新增 列表操作 (List operations) 组件。
    • 新增 变量聚合器 (Variable aggregator) 组件。
  • 数据源
    • 支持 S3 兼容的数据源,例如 MinIO。
    • 新增与 JIRA 的数据同步。
  • 继续重新设计 个人资料 (Profile) 页面布局。
  • 将 Flask Web 框架从同步升级为异步,增加了并发能力,并防止请求上游 LLM 服务时引起阻塞问题。

修复的问题

  • v0.22.0 的一个问题:在使用 -full 版本 RAGFlow 构建的包含已解析文件的数据集中,用户无法解析新上传的文件或切换嵌入模型。
  • Word 文档中图像拼接的问题。#11310
  • 聊天记录中图文混排无法正确显示的问题。

新增支持模型

  • Gemini 3 Pro Preview

v0.22.0

发布于 2025 年 11 月 12 日。

重大变更

重要提示

从本版本开始,我们仅提供精简版(不含嵌入模型)Docker 镜像,并且镜像标签不再附加 -slim 后缀。

新特性

  • 数据集
    • 支持从五个在线数据源(AWS S3、Google Drive、Notion、Confluence 和 Discord)进行数据同步。
    • RAPTOR 可以针对整个数据集或单个文档进行构建。
  • 数据摄入流水线:在 解析器 (Parser) 组件中支持 Docling 文档解析
  • 发布了全新的管理 Web UI 面板,用于图形化的用户管理和系统服务状态监控。
  • Agent
    • 支持结构化输出。
    • 检索 (Retrieval) 组件中支持元数据过滤。
    • 引入 变量聚合器 (Variable aggregator) 组件,具有数据操作和会话变量定义能力。

改进

  • 智能体:在 等待响应 (Await Response) 组件中支持可视化前序组件的输出。
  • 改版模型供应商页面。
  • 将 RAGFlow 文档引擎 Infinity 升级至 v0.6.5。

新增模型

  • Kimi-K2-Thinking

新增智能体模板

  • 交互式智能体 (Interactive Agent),结合实时用户反馈来动态优化智能体输出。

v0.21.1

发布于 2025 年 10 月 23 日。

新特性

  • 实验性:新增对使用 MinerU 进行 PDF 文档解析的支持。详见此处

改进

  • 增强了数据集和个人中心页面的 UI/UX。
  • 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.1。

修复的问题

  • 视频解析的一个问题。

v0.21.0

发布于 2025 年 10 月 15 日。

新特性

  • 可编排的数据摄入流水线:支持自定义数据摄入和清洗工作流,允许用户灵活设计数据流或在画布上直接应用官方数据流模板。
  • 优化 GraphRAG 和 RAPTOR 写入流程:将自动增量构建过程替换为手动批量构建,显著降低了构建开销。
  • 长文本 RAG:自动生成文档级目录 (TOC) 结构,以减轻因分块不准或过多导致的上下文丢失,大幅提升检索质量。该功能现可通过目录提取模板使用。详见此处
  • 视频文件解析:通过支持视频文件解析,扩展了系统的多模态数据处理能力。
  • 管理 CLI:引入了全新的系统管理命令行工具,允许用户通过命令行管理和监控 RAGFlow 的服务状态。

改进

  • 重新设计 RAGFlow 的登录和注册页面。
  • 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.0。

新增支持模型

  • 通义千问 Qwen 3 系列
  • Claude Sonnet 4.5
  • 美团 LongCat-Flash-Thinking

新增智能体模板

  • 公司研报深度解析智能体:专为金融机构设计,帮助分析师快速整理信息、生成研究报告并辅助投资决策。
  • 可编排摄入流水线模板:允许用户在画布上应用此模板,快速建立标准化的数据摄入和清洗流程。

v0.20.5

发布于 2025 年 9 月 10 日。

改进

  • Agent
    • 智能体性能优化:提高了简单任务的规划和反思速度;优化了可并行场景下的并发工具调用,显著缩短了整体响应时间。
    • 系统提示词 (System prompt) 部分提供四个框架级提示词块,支持框架层面的提示词自定义和覆盖,从而增强了灵活性和控制力。详见此处
    • 增强 执行 SQL (Execute SQL) 组件:将原有的变量引用组件替换为文本输入框,允许用户编写自由格式的 SQL 查询并引用变量。详见此处
  • 聊天:重新启用 推理 (Reasoning)跨语言搜索 (Cross-language search)

新增支持模型

  • 美团 LongCat
  • Kimi:kimi-k2-turbo-preview 和 kimi-k2-0905-preview
  • Qwen:qwen3-max-preview
  • SiliconFlow:DeepSeek V3.1

修复的问题

  • 数据集:删除的文件仍然可以被检索到。
  • 聊天:无法与 Ollama 模型进行对话。
  • Agent
    • 引用 (Cite) 开关失效的问题。
    • 处于任务模式下的智能体仍需要对话触发的问题。
    • 多轮对话中出现重复回答的问题。
    • 并行执行结果出现重复总结的问题。

API 变更

HTTP API

Python API

v0.20.4

发布于 2025 年 8 月 27 日。

改进

  • 智能体组件:完成智能体组件的中文化。
  • 引入 ENABLE_TIMEOUT_ASSERTION 环境变量,用于启用或禁用文件解析任务的超时断言。
  • 数据集
    • 改进 Markdown 文件解析,支持 AST 以避免非预期的分块。
    • 增强 HTML 解析,支持基于 bs4 的 HTML 标签遍历。

新增支持模型

智谱 GLM-4.5

新增智能体模板

电商客服工作流:专为处理产品特性咨询、多产品对比(使用内部数据集)以及管理安装预约而设计的模板。

修复的问题

  • 数据集
    • 无法与团队共享资源的问题。
    • 上传文件的数量和大小限制不当的问题。
  • 对话
    • 回答中无法预览引用的文件的问题。
    • 文件上传后无法发送消息的问题。
  • OAuth2 认证失败的问题。
  • 数据集中多条件元数据检索的逻辑错误。
  • 多轮对话中引用数量无限增加的问题。

v0.20.3

发布于 2025 年 8 月 20 日。

改进

  • 改版 数据集 (Datasets)聊天 (Chat)搜索 (Search) 页面的用户界面。
  • 搜索和聊天:引入文档级元数据过滤,支持在聊天或搜索时进行自动或手动过滤。
  • 搜索:支持创建针对各种业务场景定制的搜索应用。
  • 聊天:支持在单个 聊天 (Chat) 页面上对比多达三个聊天模型设置的回答表现。
  • Agent
    • 智能体 (Agent) 组件中实现了启用或禁用引用的开关。
    • 引入了拖拽式组件创建方法。
  • 文档:修正了 API 参考中的不准确之处。

新增智能体模板

  • 报告智能体:用于内部问答场景生成总结报告的模板,支持显示表格和公式。#9427

修复的问题

  • v0.20.0 引入的超时机制导致 GraphRAG 等任务停滞的问题。
  • 智能体组件中预定义的开场白在对话中缺失的问题。
  • 提示词编辑器中的自动换行问题。
  • PyPDF 导致的内存泄漏问题。#9469

API 变更

已弃用

与 Agent 创建会话

v0.20.1

发布于 2025 年 8 月 8 日。

新特性

  • 检索 (Retrieval) 组件现在支持使用变量动态指定数据集名称。
  • 用户界面现在包含法语选项。

新增支持模型

  • GPT-5
  • Claude 4.1

新增智能体模板(工作流式和智能体式)

  • SQL 助手工作流:赋能非技术团队(如运营、产品)独立查询业务数据。
  • “选择你的知识库”工作流:允许用户在对话过程中选择要查询的数据集。#9325
  • “选择你的知识库”智能体:通过更长的推理时间提供更高质量的回答,适用于复杂查询。#9325

修复的问题

  • 智能体组件无法调用通过 vLLM 安装的模型的问题。
  • 智能体无法与团队共享的问题。
  • 将智能体嵌入网页时无法正常工作的问题。

v0.20.0

发布于 2025 年 8 月 4 日。

兼容性变更

从 v0.20.0 开始,智能体不再与早期版本兼容,升级后必须重新构建所有旧版本中存在的智能体。

新特性

  • Agent 和工作流的统一编排。
  • 对智能体进行了全面重构,极大地增强了其能力和可用性,支持多智能体配置、规划与反思以及可视化功能。
  • 全面实现 MCP 功能,支持 MCP Server 导入,智能体可以作为 MCP Client 运行,且 RAGFlow 自身也可作为 MCP Server 运行。
  • 可访问 Agent 的运行时日志。
  • 可通过管理面板查看与智能体的聊天记录。
  • 集成更强大、更稳定的 Infinity 新版本,支持以 Infinity 为底层文档引擎的自动打标签功能。
  • 支持文件引用信息的 OpenAI 兼容 API。
  • 支持新模型,包括 Kimi K2、Grok 4 和 Voyage embedding。
  • RAGFlow 代码仓库现已同步至 Gitee。
  • 引入新的模型供应商 Gitee AI。

新增智能体模板

  • 基于多智能体的深度研究 (Deep Research):由一名主智能体领导多名子智能体协同工作,区别于传统的工作流编排。
  • 利用内部数据集的智能问答聊天机器人,专为客服和培训场景设计。
  • RAGFlow 团队用于筛选、分析和记录候选人信息的简历分析模板。
  • 将原始想法转化为 SEO 友好博客内容的博客生成工作流。
  • 智能客服工作流。
  • 用户反馈分析模板,通过语义分析将用户反馈导向合适的团队。
  • 旅行规划师 (Trip Planner):使用网页搜索和地图 MCP 服务器辅助旅行规划。
  • Image Lingo:翻译上传照片中的内容。
  • 从内部数据集和互联网检索答案的信息搜索助手。

v0.19.1

发布于 2025 年 6 月 23 日。

修复的问题

  • 高并发请求时的内存泄漏问题。
  • 启用 GraphRAG 实体消解时大文件解析卡死的问题。#8223
  • 在独立模式下使用沙箱 (Sandbox) 时出现的上下文错误。#8340
  • Ollama 导致的 CPU 占用过高问题。#8216
  • 代码组件中的一个错误。#7949
  • 通过 API 创建数据集时,新增了对通过 Ollama 或 VLLM 安装的模型支持。#8069
  • 启用了针对 S3 存储桶访问的角色认证 (Role-based authentication)。#8149

新增支持模型

  • Qwen 3 Embedding。#8184
  • Voyage Multimodal 3。#7987

v0.19.0

发布于 2025 年 5 月 26 日。

新特性

  • 知识库和聊天模块现已支持 跨语言搜索,提高了中英混合数据集等语境下的检索准确率和用户体验。
  • 智能体组件:新增 代码 (Code) 组件,支持 Python 和 JavaScript 脚本,使开发者能够处理动态数据处理等更复杂的任务。
  • 增强图像显示:聊天和搜索中的图像现在直接在回答中渲染,而不是作为外部引用。知识库检索测试可以直接检索到图像,而不仅是从图像中提取的文字。
  • Claude 4 和 ChatGPT o3:开发者现在可以使用最新发布的顶级 Claude 模型和 OpenAI 最新的 ChatGPT o3 推理模型。

以下功能由我们的社区贡献:

  • 智能体组件:在 生成 (Generate) 组件中启用工具调用。感谢 notsyncing
  • Markdown 渲染:Markdown 文件中的图像引用可以在分块后显示。感谢 Woody-Hu
  • 文档引擎支持:OpenSearch 现在可以作为 RAGFlow 的文档引擎。感谢 pyyuhao

文档

新增文档

v0.18.0

发布于 2025 年 4 月 23 日。

兼容性变更

从本版本开始,移除了内置的重排序 (rerank) 模型,因为它们对检索率提升微乎其微,但会显著增加检索时间。

新特性

  • MCP server:支持通过 MCP 访问 RAGFlow 的数据集。
  • DeepDoc 支持采用 VLM 模型作为文档版面识别的处理流水线,实现对 PDF 和 DOCX 文件中图像的深度分析。
  • OpenAI 兼容 API:支持通过 OpenAI 兼容接口调用智能体。
  • 用户注册控制:管理员可通过环境变量启用或禁用用户注册。
  • 团队协作:可以将智能体共享给团队成员。
  • 智能体版本控制:所有更新均会记录,并可通过导出功能回滚至之前的版本。

export_agent

改进

  • 增强回答引用:提高了生成回答中引用的准确度。
  • 增强问答体验:用户现在可以在对话过程中手动停止流式输出。

文档

新增文档

v0.17.2

发布于 2025 年 3 月 13 日。

兼容性变更

  • 聊天配置 (Chat configuration) 中移除 Max_tokens 设置。
  • 生成 (Generate)重写 (Rewrite)分类 (Categorize)关键词 (Keyword) 智能体组件中移除 Max_tokens 设置。

从本版本开始,如果您发现 RAGFlow 的回答被截断,请检查您的模型供应商处的 Max_tokens 设置。

改进

  • 增加 OpenAI 兼容 API。
  • 引入德语用户界面。
  • 加速知识图谱提取速度。
  • 检索 (Retrieval) 智能体组件中启用了基于 Tavily 的网页搜索。
  • 添加了通义千问 QwQ 模型(OpenAI 兼容)。
  • 通用 (General) 分块方法中支持 CSV 文件。

修复的问题

  • 无法通过 Ollama/Xinference 添加模型的问题(v0.17.1 中引入的问题)。

API 变更

HTTP API

Python API

v0.17.1

发布于 2025 年 3 月 11 日。

改进

  • 提高英语分词质量。
  • 改进 Markdown 文档解析中的表格提取逻辑。
  • 更新 SiliconFlow 的模型列表。
  • 支持解析 XLS 文件 (Excel 97-2003) 并改进了相应的错误处理。
  • 支持 Huggingface 重排序模型。
  • 在聊天助手和 重写 (Rewrite) 智能体组件中启用相对时间表达(如“现在”、“昨天”、“上周”、“明年”等)。

修复的问题

  • 重复进行知识图谱提取的问题。
  • API 调用相关问题。
  • PDF 解析器 (PDF parser)(即 文档解析器)下拉菜单选项缺失的问题。
  • Tavily 网页搜索的一个问题。
  • AI 聊天中无法预览图表或图像的问题。

文档

新增文档

v0.17.0

发布于 2025 年 3 月 3 日。

新特性

  • AI 聊天:实现用于智能体推理的深度研究 (Deep Research)。要激活此功能,请在聊天助手对话框的 提示词引擎 (Prompt engine) 选项卡下开启 推理 (Reasoning) 开关。
  • AI 聊天:利用基于 Tavily 的网页搜索来增强智能体推理的上下文。要激活此功能,请在聊天助手对话框的 助手设置 (Assistant settings) 选项卡下输入正确的 Tavily API 密钥。
  • AI 聊天:支持在不指定数据集的情况下开启聊天。
  • AI 聊天:除了 PDF 文件外,HTML 文件现在也可以进行预览和引用。
  • 数据集:在数据集配置中新增 PDF 解析器 (PDF parser)(即 文档解析器)下拉菜单。包括耗时较长的 DeepDoc 模型选项、不进行 DLA、OCR 和 TSR 任务且速度更快的 naive 选项(纯文本),以及几个目前处于 实验性 阶段的大模型选项。详见此处
  • 智能体组件:在 生成 (Generate)模板 (Template) 组件的系统提示词字段中,可以使用 (x) 或正斜杠 / 插入可用键(变量)。
  • 对象存储:支持使用阿里云 OSS 作为文件存储选项。
  • 模型:更新了通义千问 (Qwen) 的支持模型列表,增加了 DeepSeek 专用模型;新增 ModelScope 作为模型供应商。
  • API:支持通过 API 更新文档元数据。

下图展示了 RAGFlow 深度研究 (Deep Research) 的工作流程

Image

以下是集成了深度研究的对话截图

Image

API 变更

HTTP API

更新文档 (Update document) 方法中添加了 "meta_fields" 请求体参数。

Python API

更新文档 (Update document) 方法中添加了 "meta_fields" 键选项。

文档

新增文档

v0.16.0

发布于 2025 年 2 月 6 日。

新特性

  • 支持 DeepSeek R1 和 DeepSeek V3。
  • GraphRAG 重构:知识图谱现在基于整个数据集动态构建,而非单个文件,并在新上传文件解析时自动更新。详见此处
  • 新增 迭代 (Iteration) 智能体组件和 研究报告生成器 智能体模板。详见此处
  • 新增 UI 语言:葡萄牙语。
  • 支持为数据集中的特定文件设置元数据,以增强 AI 聊天能力。详见此处
  • 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.0.dev3。
  • 支持 DeepDoc 的 GPU 加速(见 docker-compose-gpu.yml)。
  • 支持创建和引用 标签 (Tag) 数据集,作为缩小查询与响应之间语义差距的关键里程碑。
重要提示

标签数据集 功能在 Infinity 文档引擎上 不可用

文档

新增文档

v0.15.1

发布于 2024 年 12 月 25 日。

升级

  • 将 RAGFlow 的文档引擎 Infinity 升级至 v0.5.2。
  • 增强了文档解析状态的日志显示。

修复的问题

此版本修复了以下问题:

  • Infinity 返回的 SCORE not foundposition_int 错误。
  • 特定数据集中的嵌入模型一旦更改,其他数据集中的嵌入模型就无法再更改的问题。
  • 因重复加载嵌入模型导致的问答和 AI 搜索响应缓慢问题。
  • 使用 RAPTOR 解析文档失败的问题。
  • 使用 表格 (Table) 解析方法导致信息丢失的问题。
  • 各类 API 相关问题。

API 变更

HTTP API

在以下 API 中添加了可选参数 "user_id"

v0.15.0

发布于 2024 年 12 月 18 日。

新特性

  • 引入了额外的智能体专用 API。
  • 支持使用网页排名得分 (page rank score) 来提升多数据集搜索时的检索性能。
  • 在聊天和智能体模块提供 iframe,方便将 RAGFlow 集成到您的网页中。
  • 新增用于在 Kubernetes 上部署 RAGFlow 的 Helm chart。
  • 支持以 JSON 格式导入或导出智能体。
  • 支持智能体组件/工具的单步运行。
  • 新增 UI 语言:日语。
  • 支持在失败后恢复 GraphRAG 和 RAPTOR 任务,增强了任务管理的鲁棒性。
  • 添加了更多 Mistral 模型。
  • UI 新增暗黑模式,允许用户在浅色和深色主题之间切换。

改进

  • 升级了 DeepDoc 中的文档版面分析模型。
  • 显著提升了使用 Infinity 作为文档引擎时的检索性能。

API 变更

HTTP API

Python API

v0.14.1

发布于 2024 年 11 月 29 日。

改进

新增 Infinity 配置文件,以便于将 Infinity 作为文档引擎进行集成和定制。从本版本开始,对 Infinity 配置的更新可直接在 RAGFlow 中进行,并在通过 docker compose 重启 RAGFlow 后立即生效。#3715

修复的问题

此版本修复了以下问题:

  • 点击分块后无法显示或编辑其内容的问题。
  • Elasticsearch 中的 'Not found' 错误。
  • 解析过程中中文文本出现乱码的问题。
  • Polars 的兼容性问题。
  • Infinity 与 GraphRAG 之间的兼容性问题。

v0.14.0

发布于 2024 年 11 月 26 日。

新特性

  • 支持 Infinity 或 Elasticsearch(默认)作为矢量存储和全文索引的文档引擎。#2894
  • 通过为智能体增加更多变量并实现自动保存功能,提升了用户体验。
  • 吴恩达 (Andrew Ng) 的翻译智能体 启发,新增了三步翻译智能体模板。
  • 新增了 SEO 优化的博客写作智能体模板。
  • 提供了与智能体对话的 HTTP 和 Python API。
  • 支持在检索过程中使用英语同义词。
  • 优化了词权重计算,使检索时间缩短了 50%。
  • 通过增加性能指标,改进了任务执行器的监控。
  • 将 Redis 替换为 Valkey。
  • 新增三种 UI 语言(由社区贡献):印尼语、西班牙语和越南语。

兼容性变更

从本版本开始,service_config.yaml.template 取代了 service_config.yaml 用于配置后端服务。在 Docker 容器启动时,该模板文件中定义的环境变量将自动填充,并据此自动生成 service_config.yaml#3341

这种方法消除了在修改 .env 后手动更新 service_config.yaml 的需要,便于动态环境配置。

重要提示

在尝试此新方法之前,请确保您已将 代码 Docker 镜像均升级到此版本

API 变更

HTTP API

Python API

文档说明

新增文档

v0.13.0

发布日期:2024 年 10 月 31 日。

新功能

  • 为所有用户增加团队管理功能。
  • 更新 Agent UI 以提高易用性。
  • General(通用)解析方法中增加对 Markdown 分块的支持。
  • 在 Agent UI 中引入 invoke 工具。
  • 集成对 Dify 知识库 API 的支持。
  • 增加对 GLM4-9B 和 Yi-Lightning 模型的支持。
  • 引入用于数据集管理、数据集内文件管理以及聊天助手管理的 HTTP 和 Python API。
注意

下载 RAGFlow Python SDK

pip install ragflow-sdk==0.13.0

文档说明

新增文档

v0.12.0

发布日期:2024 年 9 月 30 日。

新功能

  • 提供 RAGFlow Docker 镜像的精简版(slim editions),不包含内置的 BGE/BCE 嵌入或重排序模型。
  • 改进多轮对话的效果。
  • 允许用户删除已添加的 LLM 供应商。
  • 增加对 OpenTTSSparkTTS 模型的支持。
  • General(通用)解析方法中实现 Excel to HTML 开关,允许用户将电子表格解析为 HTML 表格或按行解析为键值对。
  • 增加 Agent 工具 YahooFinance金十数据 (Jin10)
  • 增加投资顾问 Agent 模板。

兼容性变更

从本版本开始,RAGFlow 提供 Docker 镜像的精简版(slim editions),以改善网络受限用户的体验。RAGFlow 精简版镜像不含内置的 BGE/BCE 嵌入模型,大小约为 1GB;完整版约为 9GB,包含两个内置嵌入模型。

默认 Docker 镜像版本为 nightly-slim。以下列表说明了各版本之间的区别:

  • nightly-slim:最新测试版 Docker 镜像的精简版。
  • v0.12.0-slim:最新正式发布版 Docker 镜像的精简版。
  • nightly:最新测试版 Docker 镜像的完整版。
  • v0.12.0:最新正式发布版 Docker 镜像的完整版。

有关升级说明,请参阅 升级 RAGFlow

文档说明

新增文档

v0.11.0

发布日期:2024 年 9 月 14 日。

新功能

  • 在 RAGFlow UI 中引入 AI 搜索界面。
  • 支持通过 FishAudio通义千问 TTS 进行音频输出。
  • 除 MySQL 外,支持使用 Postgres 进行元数据存储。
  • 支持 S3 或 Azure Blob 等对象存储选项。
  • 支持模型供应商:AnthropicVoyage AIGoogle Cloud
  • 支持使用 腾讯云 ASR 进行语音内容识别。
  • 增加金融特定 Agent 组件:问财 (WenCai)AkShareYahooFinanceTuShare
  • 增加医疗顾问 Agent 模板。
  • 支持在以下数据集上运行检索基准测试:

v0.10.0

发布日期:2024 年 8 月 26 日。

新功能

  • 在 Agent UI 中引入 text-to-SQL 模板。
  • 实现 Agent 相关 API。
  • 加入任务执行器监控。
  • 引入 Agent 工具 GitHubDeepL百度翻译 (BaiduFanyi)和风天气 (QWeather)GoogleScholar
  • 支持 EML 文件的解析分块。
  • 支持更多 LLM 或模型服务:GPT-4o-miniPerfXCloudTogetherAIUpstageNovita AI零一万物 (01.AI)硅基流动 (SiliconFlow)PPIO讯飞星火 (XunFei Spark)Jiekou.AI百度文心一言 (Baidu Yiyan)腾讯混元 (Tencent Hunyuan)

v0.9.0

发布日期:2024 年 8 月 6 日。

新功能

  • 支持 GraphRAG 作为分块方法。
  • 引入 Agent 组件 Keyword 和搜索工具,包括 百度DuckDuckGoPubMed维基百科BingGoogle
  • 支持音频文件的语音转文本识别。
  • 支持模型供应商 GeminiGroq
  • 支持推理框架、引擎和服务,包括 LM studioOpenRouterLocalAINvidia API
  • 支持在 Xinference 中使用重排序(reranker)模型。

v0.8.0

发布日期:2024 年 7 月 8 日。

新功能

  • 支持 Agentic RAG,能够构建基于图的 RAG 和 Agent 工作流。
  • 支持模型供应商 MistralMiniMaxBedrockAzure OpenAI
  • 在 MANUAL(手动)分块方法中支持 DOCX 文件。
  • 在 Q&A(问答)分块方法中支持 DOCX、MD 和 PDF 文件。

v0.7.0

发布日期:2024 年 5 月 31 日。

新功能

  • 支持使用重排序(reranker)模型。
  • 集成重排序和嵌入模型:BCEBGEJina
  • 支持 LLM 百川 (Baichuan) 和火山方舟 (VolcanoArk)。
  • 实现 RAPTOR 以改进文本检索。
  • 在 GENERAL(通用)解析方法中支持 HTML 文件。
  • 提供用于按 ID 删除文档的 HTTP 和 Python API。
  • 支持 ARM64 平台。
重要提示

虽然我们也会在 ARM64 平台上测试 RAGFlow,但我们不维护 ARM 版本的 RAGFlow Docker 镜像。

如果您使用的是 ARM 平台,请按照此指南构建 RAGFlow Docker 镜像。

API 变更

HTTP API

Python API

v0.6.0

发布日期:2024 年 5 月 21 日。

新功能

  • 支持流式输出。
  • 提供用于获取文档切片的 HTTP 和 Python API。
  • 支持系统组件监控,包括 Elasticsearch、MySQL、Redis 和 MinIO。
  • 在 GENERAL(通用)分块方法中支持禁用布局识别 (Layout Recognition),以减少文件分块时间。

API 变更

HTTP API

Python API

v0.5.0

发布日期:2024 年 5 月 8 日。

新功能

  • 支持 LLM DeepSeek。
© . This site is unofficial and not affiliated with InfiniFlow.