跳到主要内容

9篇带“RAG”标签的文章

查看所有标签

·5分钟阅读
Yingfeng Zhang

RAGFlow 2024年度的最终版本 v0.15.0 已发布,带来了以下重要更新:

Agent 改进

此版本对 Agent 进行了多项增强,包括额外的 API、分步运行调试以及导入/导出功能。自 v0.13.0 版本以来,RAGFlow 的 Agent 结构已进行调整以提高可用性。分步运行调试功能最终完善了这一过程,允许 Agent 工作流中的操作符独立执行,从而帮助用户根据输出信息进行调试。

·9分钟阅读
Yingfeng Zhang

Infinity 是一个专门为检索增强生成(RAG)设计的数据库,在功能和性能上均表现出色。它为密集和稀疏向量搜索以及全文搜索提供了高性能能力,并为这些数据类型提供了高效的范围过滤。此外,它还具有基于张量的重排序功能,能够实现强大的多模态 RAG 并集成与 Cross Encoders 相当的排序能力。

·5分钟阅读
Yingfeng Zhang

RAGFlow 响应社区需求,引入了 Text2SQL 功能。传统的 Text2SQL 需要对模型进行微调,这在企业环境中与 RAG 或 Agent 组件一起使用时会显著增加部署和维护成本。RAGFlow 基于 RAG 的 Text2SQL 利用现有(已连接)的大型语言模型(LLM),无需额外的微调模型即可与其他的 RAG/Agent 组件无缝集成。

·6分钟阅读
Yingfeng Zhang

RAGFlow v0.9 引入了对 GraphRAG 的支持,该技术最近由微软开源,据称是下一代检索增强生成(RAG)。在 RAGFlow 框架内,我们对 RAG 2.0 有更全面的定义。这个提出的端到端系统以搜索为中心,包含四个阶段。后两个阶段——索引和检索——主要需要一个专用的数据库,而前两个阶段定义如下

·8分钟阅读
Yingfeng Zhang

搜索技术仍然是计算机科学中的主要挑战之一,很少有商业产品能够有效地进行搜索。在大型语言模型(LLMs)兴起之前,强大的搜索能力并不被认为是必需的,因为它并没有直接提升用户体验。然而,随着 LLMs 开始普及,将 LLMs 应用于企业环境需要一个强大的内置检索系统。这也被称为检索增强生成(RAG)——在将用户查询最相关的内容提供给 LLM 生成最终答案之前,先搜索内部知识库。

·7分钟阅读
Yingfeng Zhang

从 v0.8 版本开始,RAGFlow 正式进入 Agent 时代,在后端提供了一个全面的基于图的任务编排框架,并在前端提供了一个无代码工作流编辑器。为什么选择 Agent 方式?这个功能与现有的工作流编排系统有何不同?

·6分钟阅读
Yingfeng Zhang

一个朴素的 RAG 系统的工作流程可以总结如下:RAG 系统使用用户查询从指定的数据源进行检索,对检索结果进行重排序,附加提示词,然后将它们发送给 LLM 以生成最终答案。

在用户意图明确的场景下,朴素 RAG 就足够了,因为答案包含在检索结果中,可以直接发送给 LLM。然而,在大多数情况下,模糊的用户意图是常态,需要迭代查询来生成最终答案。例如,涉及总结多个文档的问题需要多步骤推理。这些场景需要 Agentic RAG,它在问答过程中涉及任务编排机制。

Agent 和 RAG 相辅相成。Agentic RAG,顾名思义,是一种基于 Agent 的 RAG。Agentic RAG 与朴素 RAG 的主要区别在于,Agentic RAG 引入了一种动态的 Agent 编排机制,该机制对检索结果进行评估,根据每个用户查询的意图重写查询,并采用“多跳”推理来处理复杂的问答任务。