跳转到主内容

更新日志

最新版本的主要特性、改进和缺陷修复。

  1. v0.24.0

    发布日期:2026年2月10日。

    新特性

    • 知识库
      • 引入 API 和 SDK,方便开发者集成。
      • 将记忆提取日志输出到控制台,以便调试和追踪。
    • 数据集
      • 支持批量元数据管理。
      • 将 "ToC (目录)" 重命名为 "PageIndex"。详见此处
    • Agent
      • 推出全新的类似对话的 Agent 会话管理界面,保留会话和对话历史。
      • 引入多沙箱机制,支持本地 gVisor 和阿里云,兼容主流沙箱 API(可在管理页面配置)。
    • 对话
      • 新增“思维(Thinking)”模式,并移除之前的“推理(Reasoning)”配置选项。
      • 针对深度研究场景优化检索策略,提升召回准确率。
    • 管理员
      • 支持配置多个管理员账号。
    • 模型配置中心
      • 添加新模型时增加模型连接测试功能。

    MySQL 替代方案

    • 支持 OceanBase 作为 MySQL 的替代方案。

    模型支持

    • Kimi 2.5
    • 阶跃星辰 (Stepfun) 3
    • doubao-embedding-vision
    • PaddleOCR-VL

    数据源

    • Zendesk
    • Bitbucket
  2. v0.23.1

    发布日期:2025年12月31日。

    改进

    • 记忆:提高选择所有记忆类型时记忆提取的稳定性。
    • RAG:优化了图片和表格的上下文窗口提取策略。

    已修复问题

    • 知识库
      • 如果存在空的记忆对象,RAGFlow 服务器无法启动。
      • 无法删除新创建的空记忆。
    • RAG:不支持 MDX 文件解析。

    数据源

    • GitHub
    • Gitlab
    • Asana
    • IMAP
  3. v0.23.0

    发布日期:2025年12月27日。

    新特性

    • 知识库
      • 实现用于管理记忆的 Memory(记忆) 界面。
      • 支持通过 Retrieval(检索)Message(消息) 组件配置上下文。
    • Agent
      • 通过重构底层架构,提高 Agent 组件的性能。
      • Agent 组件现在可以输出结构化数据,供下游组件使用。
      • 支持使用 Webhook 触发 Agent 执行。
      • 支持语音输入/输出。
      • 支持在每个 Agent 组件中配置多个 Retrieval 组件。
    • 数据解析流水线
      • 支持在 Transformer 组件中提取目录,以提高长文本 RAG 性能。
    • 数据集
      • 支持为图片和表格配置上下文窗口。
      • 引入父子切片策略。
      • 支持在文件解析过程中自动生成元数据。
    • 聊天:支持语音输入。

    改进

    • RAG:大幅加速 GraphRAG 生成速度。
    • 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.15(向后兼容)。

    数据源

    • Google Cloud Storage
    • Gmail
    • Dropbox
    • WebDAV
    • Airtable

    模型支持

    • GPT-5.2
    • GPT-5.2 Pro
    • GPT-5.1
    • GPT-5.1 Instant
    • Claude Opus 4.5
    • MiniMax M2
    • GLM-4.7
    • MinerU 配置界面。
    • AI Badgr (模型供应商)。

    API 变更

    HTTP API

  4. v0.22.1

    发布日期:2025年11月19日。

    改进

    • Agent
      • 支持以 Word 或 Markdown 格式导出 Agent 输出。
      • 新增 List operations(列表操作) 组件。
      • 新增 Variable aggregator(变量聚合器) 组件。
    • 数据源
      • 支持 S3 兼容的数据源,例如 MinIO。
      • 增加与 JIRA 的数据同步。
    • 继续重新设计 个人资料 (Profile) 页面布局。
    • 将 Flask Web 框架从同步升级为异步,增加并发量并防止请求上游 LLM 服务时导致的阻塞问题。

    已修复问题

    • v0.22.0 的一个问题:在使用 -full 版本 RAGFlow 中内置模型解析文件的库中,用户无法解析上传的文件或切换嵌入模型。
    • Word 文档中图片拼接问题。#11310
    • 聊天记录中图文混排显示不正确的问题。

    新增支持模型

    • Gemini 3 Pro Preview
  5. v0.22.0

    发布日期:2025年11月12日。

    重大变更

    重要提示

    从该版本开始,我们仅提供精简版(slim,不含嵌入模型)Docker 镜像,且不再在镜像标签后添加 -slim 后缀。

    新特性

    • 数据集
      • 支持从五个在线源(AWS S3、Google Drive、Notion、Confluence 和 Discord)同步数据。
      • RAPTOR 可以基于整个数据集或单个文档构建。
    • 解析流水线:在 Parser 组件中支持 Docling 文档解析
    • 推出全新的管理 Web UI 面板,用于图形化用户管理和服务状态监控。
    • Agent
      • 支持结构化输出。
      • 支持在 Retrieval 组件中进行元数据过滤。
      • 引入 Variable aggregator(变量聚合器) 组件,具备数据操作和会话变量定义功能。

    改进

    • Agent:支持在 Await Response(等待响应) 组件中可视化前序组件的输出。
    • 改版模型供应商页面。
    • 将 RAGFlow 文档引擎 Infinity 升级至 v0.6.5。

    新增模型

    • Kimi-K2-Thinking

    新增 Agent 模板

    • 交互式 Agent:结合实时用户反馈来动态优化 Agent 输出。
  6. v0.21.1

    发布日期:2025年10月23日。

    新特性

    • 实验性:支持使用 MinerU 进行 PDF 文档解析。详见此处

    改进

    • 优化数据集和个人中心页面的 UI/UX。
    • 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.1。

    已修复问题

    • 修复了视频解析的问题。
  7. v0.21.0

    发布日期:2025年10月15日。

    新特性

    • 可编排的解析流水线:支持自定义数据摄取和清洗工作流,允许用户灵活设计数据流或在画布上直接应用官方数据流模板。
    • 优化 GraphRAG 和 RAPTOR 的写入流程:将自动增量构建过程替换为手动批量构建,显著降低构建开销。
    • 长文本 RAG:自动生成文档级目录 (TOC) 结构,以减轻由于分块不准或过多导致的上下文丢失,显著提高检索质量。该功能现可通过目录提取模板使用。详见此处
    • 视频文件解析:通过支持视频文件解析,扩展了系统的多模态数据处理能力。
    • 管理员 CLI:引入全新的系统管理命令行工具,允许用户通过命令行管理和监控 RAGFlow 的服务状态。

    改进

    • 重新设计 RAGFlow 的登录和注册页面。
    • 将 RAGFlow 文档引擎 Infinity 升级至 v0.6.0。

    新增支持模型

    • 通义千问 (Qwen) 3 系列
    • Claude Sonnet 4.5
    • 美团 LongCat-Flash-Thinking

    新增 Agent 模板

    • 公司研报深度解读 Agent:专为金融机构设计,帮助分析师快速整理信息、生成研究报告并辅助投资决策。
    • 可编排解析流水线模板:允许用户在画布上应用此模板,快速建立标准化的数据摄取和清洗流程。
  8. v0.20.5

    发布日期:2025年9月10日。

    改进

    • Agent
      • 优化 Agent 性能:提高简单任务的规划和反思速度;优化可并行场景下的工具并发调用,显著缩短整体响应时间。
      • System prompt(系统提示词) 部分提供四个框架级提示块,支持在框架层面自定义和覆盖提示词,从而增强灵活性和控制力。详见此处
      • 增强 Execute SQL(执行 SQL) 组件:将原有的变量引用组件替换为文本输入框,允许用户编写自由格式的 SQL 查询并引用变量。详见此处
    • 聊天:重新启用 Reasoning(推理)Cross-language search(跨语言搜索)

    新增支持模型

    • 美团 LongCat
    • Kimi: kimi-k2-turbo-preview 和 kimi-k2-0905-preview
    • Qwen: qwen3-max-preview
    • SiliconFlow: DeepSeek V3.1

    已修复问题

    • 数据集:已删除的文件仍然可以被检索到。
    • 聊天:无法与 Ollama 模型进行对话。
    • Agent
      • Cite(引用) 开关失效问题。
      • 任务模式下的 Agent 仍需要通过对话触发。
      • 多轮对话中出现重复答案的问题。
      • 并行执行结果的重复总结问题。

    API 变更

    HTTP API

    • 检索切片 方法中增加 body 参数 "metadata_condition",支持检索时的元数据过滤。#9877

    Python API

    • 检索切片 方法中增加参数 metadata_condition,支持检索时的元数据过滤。#9877
  9. v0.20.4

    发布日期:2025年8月27日。

    改进

    • Agent 组件:完成 Agent 组件的中文本地化。
    • 引入 ENABLE_TIMEOUT_ASSERTION 环境变量,用于启用或禁用文件解析任务的超时断言。
    • 数据集
      • 改进 Markdown 文件解析,支持 AST 以避免非预期的切片。
      • 增强 HTML 解析,支持基于 bs4 的 HTML 标签遍历。

    新增支持模型

    智谱 GLM-4.5

    新增 Agent 模板

    电商客服工作流:专为处理关于产品特性、多产品对比(基于内部数据集)的咨询以及管理安装预约而设计的模板。

    已修复问题

    • 数据集
      • 无法与团队共享资源。
      • 上传文件的数量和大小限制不当。
    • 对话
      • 无法预览响应中引用的文件。
      • 文件上传后无法发送消息。
    • OAuth2 认证失败。
    • 数据集中多条件元数据检索的逻辑错误。
    • 多轮对话中引用信息无限增加的问题。
  10. v0.20.3

    发布日期:2025年8月20日。

    改进

    • 改版 Datasets(数据集)Chat(聊天)Search(搜索) 页面的用户界面。
    • 搜索和聊天:引入文档级元数据过滤,支持在聊天或搜索时进行自动或手动过滤。
    • 搜索:支持针对各种业务场景创建搜索应用。
    • 聊天:支持在单个 Chat 页面上比较最多三个聊天模型设置的答案表现。
    • Agent
      • Agent 组件中实现引用功能的开启/关闭切换开关。
      • 引入拖放方式创建组件。
    • 文档:修正了 API 参考中的错误。

    新增 Agent 模板

    • 报表 Agent:用于内部问答场景生成总结报告的模板,支持显示表格和公式。#9427

    已修复问题

    • v0.20.0 中引入的超时机制导致 GraphRAG 等任务中断。
    • Agent 组件中预定义的开场白在对话中缺失。
    • 提示词编辑器中的自动换行问题。
    • PyPDF 导致的内存泄漏问题。#9469

    API 变更

    已弃用

    与 Agent 创建会话

  11. v0.20.1

    发布日期:2025年8月8日。

    新特性

    • Retrieval 组件现在支持使用变量动态指定数据集名称。
    • 用户界面现在包含法语选项。

    新增支持模型

    • GPT-5
    • Claude 4.1

    新增 Agent 模板(包括工作流和 Agentic)

    • SQL Assistant 工作流:授权非技术团队(如运营、产品)能够独立查询业务数据。
    • 知识库选择工作流:允许用户在对话过程中选择要查询的数据集。#9325
    • 知识库选择 Agent:通过延长的推理时间提供更高质量的响应,适用于复杂查询。#9325

    已修复问题

    • Agent 组件无法调用通过 vLLM 安装的模型。
    • Agent 无法与团队共享。
    • 将 Agent 嵌入网页的功能无法正常工作。
  12. v0.20.0

    发布日期:2025年8月4日。

    兼容性变更

    从 v0.20.0 开始,Agent 不再兼容早期版本,所有旧版本的 Agent 在升级后都必须重新构建。

    新特性

    • Agent 和工作流的统一编排。
    • 全面重构 Agent,极大增强了其功能和易用性,支持多 Agent 配置、规划与反思以及可视化功能。
    • 全面实现 MCP 功能,支持 MCP Server 导入、Agent 作为 MCP Client,以及 RAGFlow 自身作为 MCP Server 运行。
    • 可访问 Agent 的运行时日志。
    • 可通过管理面板查看与 Agent 的聊天历史记录。
    • 集成更稳定新版的 Infinity,支持以 Infinity 作为底层文档引擎的自动标签功能。
    • 兼容 OpenAI 的 API,且支持文件引用信息。
    • 支持新模型,包括 Kimi K2、Grok 4 和 Voyage embedding。
    • RAGFlow 的代码库现已镜像至 Gitee。
    • 引入新的模型供应商 Gitee AI。

    引入新的 Agent 模板

    • 基于多 Agent 的深度研究:由主 Agent 领导多个子 Agent 的协同工作模式,区别于传统的工作流编排。
    • 利用内部数据集的智能问答聊天机器人,专为客户服务和培训场景设计。
    • RAGFlow 团队用于筛选、分析和记录候选人信息的简历分析模板。
    • 将原始想法转化为 SEO 友好型博客内容的博客生成工作流。
    • 智能客服工作流。
    • 用户反馈分析模板,通过语义分析将用户反馈定向至相应的团队。
    • 行程规划:使用网页搜索和地图 MCP 服务器辅助旅游规划。
    • Image Lingo:翻译上传照片中的内容。
    • 信息搜索助手,可从内部数据集和网络中检索答案。
  13. v0.19.1

    发布日期:2025年6月23日。

    已修复问题

    • 修复了高并发请求期间的内存泄漏问题。
    • 修复了启用 GraphRAG 实体消解时,大文件解析冻结的问题。#8223
    • 修复了在独立模式下使用沙箱时发生的上下文错误。#8340
    • 修复了 Ollama 导致的 CPU 使用率过高问题。#8216
    • 修复了代码组件 (Code Component) 中的一个 Bug。#7949
    • 通过 API 创建数据集时,增加了对通过 Ollama 或 VLLM 安装的模型的支持。#8069
    • 启用了针对 S3 存储桶访问的角色鉴权。#8149

    新增支持模型

    • Qwen 3 Embedding。#8184
    • Voyage Multimodal 3。#7987
  14. v0.19.0

    发布日期:2025年5月26日。

    新特性

    • 知识库和聊天模块支持 跨语言搜索,在多语言环境(如中英双语数据集)下增强了搜索准确性和用户体验。
    • Agent 组件:新增 Code(代码) 组件,支持 Python 和 JavaScript 脚本,允许开发者处理动态数据处理等更复杂的任务。
    • 增强图片显示:聊天和搜索中的图片现在直接在响应中渲染,不再作为外部引用。知识库检索测试可以直接检索到图片,而不仅仅是从图片中提取的文本。
    • Claude 4 和 ChatGPT o3:开发者现在可以使用最新发布的顶级 Claude 模型和 OpenAI 最新的 ChatGPT o3 推理模型。

    以下功能由社区贡献

    • Agent 组件:在 Generate(生成)组件中启用工具调用。感谢 notsyncing
    • Markdown 渲染:Markdown 文件中的图片引用在切片后可以正常显示。感谢 Woody-Hu
    • 文档引擎支持:OpenSearch 现在可以作为 RAGFlow 的文档引擎。感谢 pyyuhao

    文档

    新增文档

  15. v0.18.0

    发布日期:2025年4月23日。

    兼容性变更

    从该版本开始,移除了内置的重排序 (rerank) 模型,因为它们对检索率的提升微乎其微,但会显著增加检索时间。

    新特性

    • MCP 服务器:允许通过 MCP 访问 RAGFlow 的数据集。
    • DeepDoc 支持在文档布局识别过程中采用 VLM 模型作为处理流程,支持对 PDF 和 DOCX 文件中的图片进行深入分析。
    • OpenAI 兼容 API:可以通过 OpenAI 兼容的 API 调用 Agent。
    • 用户注册控制:管理员可以通过环境变量启用或禁用用户注册。
    • 团队协作:Agent 可以与团队成员共享。
    • Agent 版本控制:所有更新都会持续记录,并可以通过导出的方式回滚到之前的版本。

    export_agent

    改进

    • 增强答案引用:提升了生成响应中引用信息的准确性。
    • 增强问答体验:用户现在可以在对话过程中手动停止流式输出。

    文档

    新增文档

  16. v0.17.2

    发布日期:2025年3月13日。

    兼容性变更

    • Chat configuration(聊天配置) 中移除 Max_tokens 设置。
    • Generate(生成)Rewrite(重写)Categorize(分类)Keyword(关键词) 等 Agent 组件中移除 Max_tokens 设置。

    从该版本开始,如果您发现 RAGFlow 的响应被截断,请检查您的模型供应商处的 Max_tokens 设置。

    改进

    • 增加 OpenAI 兼容的 API。
    • 引入德语用户界面。
    • 加速知识图谱提取速度。
    • Retrieval Agent 组件中启用基于 Tavily 的网页搜索。
    • 新增通义千问 QwQ 模型(OpenAI 兼容)。
    • General 切片方法中支持 CSV 文件。

    已修复问题

    • 无法通过 Ollama/Xinference 添加模型的问题(此问题在 v0.17.1 中引入)。

    API 变更

    HTTP API

    Python API

  17. v0.17.1

    发布日期:2025年3月11日。

    改进

    • 提高英语分词质量。
    • 优化 Markdown 文档解析中的表格提取逻辑。
    • 更新 SiliconFlow 的模型列表。
    • 支持解析 XLS 文件 (Excel 97-2003),并改进了相应的错误处理。
    • 支持 Huggingface 重排序 (rerank) 模型。
    • 在聊天助手和 Rewrite Agent 组件中支持相对时间表达式(如 "现在"、"昨天"、"上周"、"明年" 等)。

    已修复问题

    • 修复了重复的知识图谱提取问题。
    • 修复了 API 调用的一些问题。
    • 修复了 PDF parser(即 Document parser)下拉菜单选项缺失的问题。
    • 修复了 Tavily 网页搜索的一个问题。
    • 修复了 AI 聊天中无法预览图表或图片的问题。

    文档

    新增文档

  18. v0.17.0

    发布日期:2025年3月3日。

    新特性

    • AI 聊天:实现用于 Agentic 推理的深度研究 (Deep Research) 功能。开启方式:在聊天助手对话框的 Prompt engine(提示词引擎) 选项卡下开启 Reasoning(推理) 开关。
    • AI 聊天:利用基于 Tavily 的网页搜索来增强 Agentic 推理的上下文。开启方式:在聊天助手对话框的 Assistant settings(助手设置) 选项卡下输入正确的 Tavily API 密钥。
    • AI 聊天:支持在不指定数据集的情况下开启聊天。
    • AI 聊天:除了 PDF 文件外,HTML 文件现在也可以进行预览和引用。
    • 数据集:在数据集配置中新增 PDF parser(即 Document parser)下拉菜单。包括耗时较长的 DeepDoc 模型选项、跳过文档布局分析 (DLA)、OCR 和表格识别 (TSR) 的极速 naive(纯文本)选项,以及多个目前处于 实验性 阶段的大模型选项。详见此处
    • Agent 组件:可以在 Generate(生成)Template(模板) 组件的系统提示词字段中使用 (x) 或正斜杠 / 插入可用键(变量)。
    • 对象存储:支持使用阿里云 OSS 作为文件存储选项。
    • 模型:更新了通义千问 (Qwen) 的支持模型列表,增加了 DeepSeek 特定模型;新增 ModelScope 作为模型供应商。
    • API:可以通过 API 更新文档元数据。

    下图展示了 RAGFlow 深度研究的工作流程

    Image

    以下是集成深度研究后的对话截图

    Image

    API 变更

    HTTP API

    更新文档 方法中增加 body 参数 "meta_fields"

    Python API

    更新文档 方法中增加键选项 "meta_fields"

    文档

    新增文档

  19. v0.16.0

    发布日期:2025年2月6日。

    新特性

    • 支持 DeepSeek R1 和 DeepSeek V3。
    • GraphRAG 重构:知识图谱现在基于整个数据集动态构建,而非单个文件,并在新上传文件解析时自动更新。详见此处
    • 新增 Iteration(迭代) Agent 组件和 Research report generator(研究报告生成器) Agent 模板。详见此处
    • 新增 UI 语言:葡萄牙语。
    • 允许为数据集中的特定文件设置元数据,以增强 AI 对话能力。详见此处
    • 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.0.dev3。
    • 支持 DeepDoc 的 GPU 加速(参见 docker-compose-gpu.yml)。
    • 支持创建和引用 Tag(标签) 数据集,这是弥补查询与响应之间语义鸿沟的关键里程碑。
    重要提示

    Tag 数据集 功能在 Infinity 文档引擎上 暂不可用

    文档

    新增文档

  20. v0.15.1

    发布日期:2024年12月25日。

    升级

    • 将 RAGFlow 的文档引擎 Infinity 升级至 v0.5.2。
    • 增强了文档解析状态的日志显示。

    已修复问题

    本版本修复了以下问题

    • 修复了 Infinity 返回的 SCORE not foundposition_int 错误。
    • 修复了某个数据集的嵌入模型更改后,其他数据集的嵌入模型无法更改的问题。
    • 修复了由于重复加载嵌入模型导致的问答和 AI 搜索响应缓慢的问题。
    • 修复了使用 RAPTOR 解析文档失败的问题。
    • 修复了使用 Table(表格) 解析方法导致信息丢失的问题。
    • 修复了各种 API 相关问题。

    API 变更

    HTTP API

    在以下 API 中添加了可选参数 "user_id"

  21. v0.15.0

    发布日期:2024年12月18日。

    新特性

    • 引入额外的 Agent 特定 API。
    • 支持在跨多个数据集搜索时使用 Page Rank 评分来提高检索性能。
    • 在聊天和 Agent 中提供 iframe,方便将 RAGFlow 集成到您的网页中。
    • 增加用于在 Kubernetes 上部署 RAGFlow 的 Helm chart。
    • 支持以 JSON 格式导入或导出 Agent。
    • 支持 Agent 组件/工具的单步运行。
    • 新增 UI 语言:日语。
    • 支持从失败处恢复 GraphRAG 和 RAPTOR 任务,增强了任务管理的韧性。
    • 增加更多 Mistral 模型。
    • 在 UI 中增加深色模式,允许用户在浅色和深色主题之间切换。

    改进

    • 升级了 DeepDoc 中的文档布局分析模型。
    • 大幅提升了使用 Infinity 作为文档引擎时的检索性能。

    API 变更

    HTTP API

    Python API

  22. v0.14.1

    发布日期:2024年11月29日。

    改进

    添加了 Infinity 的配置文件,以方便将 Infinity 作为文档引擎进行集成和定制。从该版本开始,可以直接在 RAGFlow 中更新 Infinity 的配置,并在使用 docker compose 重启 RAGFlow 后立即生效。 #3715

    问题修复

    本版本修复了以下问题

    • 点击分片后无法显示或编辑其内容。
    • Elasticsearch 中出现 'Not found' 错误。
    • 解析过程中中文文本出现乱码。
    • Polars 的兼容性问题。
    • Infinity 与 GraphRAG 之间的兼容性问题。
  23. v0.14.0

    发布于 2024 年 11 月 26 日。

    新功能

    • 支持使用 Infinity 或 Elasticsearch (默认) 作为文档引擎,用于向量存储和全文索引。 #2894
    • 通过在 Agent 中添加更多变量并实现自动保存来增强用户体验。
    • 添加了三步翻译 Agent 模板,灵感源自 吴恩达 (Andrew Ng) 的翻译 Agent
    • 添加了 SEO 优化的博客写作 Agent 模板。
    • 提供用于与 Agent 对话的 HTTP 和 Python API。
    • 在检索过程中支持使用英语同义词。
    • 优化了词项权重计算,将检索时间缩短了 50%。
    • 通过增加额外的性能指标来改进任务执行器的监控。
    • 将 Redis 替换为 Valkey。
    • 新增三种 UI 语言(由社区贡献):印尼语、西班牙语和越南语。

    兼容性变更

    从该版本开始,service_config.yaml.template 取代 service_config.yaml 用于配置后端服务。Docker 容器启动时,会自动填充该模板文件中定义的环境变量,并据此自动生成 service_config.yaml#3341

    这种方法消除了在修改 .env 后手动更新 service_config.yaml 的需要,方便了动态环境配置。

    重要提示

    在尝试此新方法之前,请确保您已将 代码 Docker 镜像均升级至此版本

    API 变更

    HTTP API

    Python API

    文档

    新增文档

  24. v0.13.0

    发布于 2024 年 10 月 31 日。

    新功能

    • 为所有用户添加了团队管理功能。
    • 更新了 Agent UI 以提高可用性。
    • General(通用)分片方法中添加了对 Markdown 分片的支持。
    • 在 Agent UI 中引入了 invoke 工具。
    • 集成了对 Dify 知识库 API 的支持。
    • 添加了对 GLM4-9B 和 Yi-Lightning 模型的支持。
    • 引入了用于数据集管理、数据集内文件管理以及聊天助手管理的 HTTP 和 Python API。
    注意

    下载 RAGFlow Python SDK

    pip install ragflow-sdk==0.13.0

    文档

    新增文档

  25. v0.12.0

    发布于 2024 年 9 月 30 日。

    新功能

    • 提供 RAGFlow Docker 镜像的精简版 (slim),其中不包含内置的 BGE/BCE 嵌入或重排序模型。
    • 改进了多轮对话的结果。
    • 允许用户移除已添加的 LLM 厂商。
    • 添加了对 OpenTTSSparkTTS 模型的支持。
    • General(通用)分片方法中实现了 Excel to HTML 开关,允许用户将电子表格解析为 HTML 表格或按行解析为键值对。
    • 添加了 Agent 工具 YahooFinanceJin10
    • 添加了投资顾问 Agent 模板。

    兼容性变更

    从该版本开始,RAGFlow 提供其 Docker 镜像的精简版 (slim),以改善互联网访问受限用户的体验。RAGFlow Docker 镜像的精简版不包含内置的 BGE/BCE 嵌入模型,大小约为 1GB;完整版 RAGFlow 约为 9GB,包含两个内置嵌入模型。

    默认的 Docker 镜像版本为 nightly-slim。以下列表说明了不同版本之间的区别

    • nightly-slim: 最新测试通过的 Docker 镜像的精简版。
    • v0.12.0-slim: 最新官方发布的 Docker 镜像的精简版。
    • nightly: 最新测试通过的 Docker 镜像的完整版。
    • v0.12.0: 最新官方发布的 Docker 镜像的完整版。

    有关升级说明,请参阅 升级 RAGFlow

    文档

    新增文档

  26. v0.11.0

    发布于 2024 年 9 月 14 日。

    新功能

    • 在 RAGFlow UI 中引入了 AI 搜索界面。
    • 支持通过 FishAudio通义千问 TTS 进行音频输出。
    • 除了 MySQL 之外,还支持使用 Postgres 进行元数据存储。
    • 支持 S3 或 Azure Blob 等对象存储选项。
    • 支持的模型厂商:AnthropicVoyage AIGoogle Cloud
    • 支持使用 腾讯云 ASR 进行音频内容识别。
    • 添加了金融类 Agent 组件:问财 (WenCai)AkShareYahooFinanceTushare
    • 添加了医疗顾问 Agent 模板。
    • 支持在以下数据集上运行检索基准测试
  27. v0.10.0

    发布于 2024 年 8 月 26 日。

    新功能

    • 在 Agent UI 中引入了 Text-to-SQL 模板。
    • 实现了 Agent API。
    • 集成了对任务执行器的监控。
    • 引入了 Agent 工具 GitHubDeepL百度翻译和风天气 (QWeather)GoogleScholar
    • 支持 EML 文件的分片。
    • 支持更多 LLM 或模型服务:GPT-4o-miniPerfXCloudTogetherAIUpstageNovita AI零一万物 (01.AI)硅基流动 (SiliconFlow)PPIO讯飞星火Jiekou.AI百度文心一言腾讯混元
  28. v0.9.0

    发布于 2024 年 8 月 6 日。

    新功能

    • 支持 GraphRAG 作为分片方法。
    • 引入了 Agent 组件 Keyword 和搜索工具,包括 百度DuckDuckGoPubMed维基百科必应 (Bing)谷歌
    • 支持音频文件的语音转文本识别。
    • 支持模型厂商 GeminiGroq
    • 支持推理框架、引擎和服务,包括 LM studioOpenRouterLocalAINvidia API
    • 支持在 Xinference 中使用重排序 (reranker) 模型。
  29. v0.8.0

    发布于 2024 年 7 月 8 日。

    新功能

    • 支持 Agentic RAG,能够基于图形构建 RAG 和 Agent 工作流。
    • 支持模型厂商 MistralMiniMaxBedrockAzure OpenAI
    • 在 MANUAL(手动)分片方法中支持 DOCX 文件。
    • 在 Q&A 分片方法中支持 DOCX、MD 和 PDF 文件。
  30. v0.7.0

    发布于 2024 年 5 月 31 日。

    新功能

    • 支持使用重排序 (reranker) 模型。
    • 集成了重排序和嵌入模型:BCEBGEJina
    • 支持 LLM 百川 (Baichuan) 和 火山引擎 (VolcanoArk)。
    • 实现了 RAPTOR 以改进文本检索。
    • 在 GENERAL(通用)分片方法中支持 HTML 文件。
    • 提供用于按 ID 删除文档的 HTTP 和 Python API。
    • 支持 ARM64 平台。
    重要提示

    虽然我们也在 ARM64 平台上测试 RAGFlow,但我们不维护 ARM 版本的 RAGFlow Docker 镜像。

    如果您使用 ARM 平台,请参考 此指南 来构建 RAGFlow Docker 镜像。

    API 变更

    HTTP API

    Python API

  31. v0.6.0

    发布于 2024 年 5 月 21 日。

    新功能

    • 支持流式输出。
    • 提供用于检索文档分片的 HTTP 和 Python API。
    • 支持对系统组件进行监控,包括 Elasticsearch、MySQL、Redis 和 MinIO。
    • 支持在 GENERAL(通用)分片方法中禁用 Layout Recognition(布局识别),以减少文件分片时间。

    API 变更

    HTTP API

    Python API

  32. v0.5.0

    发布于 2024 年 5 月 8 日。

    新功能

    • 支持 LLM DeepSeek。
© . This site is unofficial and not affiliated with InfiniFlow.