随着2024年即将结束,检索增强生成(RAG)的发展可谓风起云涌。让我们从多个角度全面回顾这一年的进展。
7篇标记为“agent”的帖子
查看所有标签深入了解RAGFlow v0.15.0
RAGFlow 2024年度的最终版本 v0.15.0 已经发布,带来了以下重要更新
Agent 改进
该版本对 Agent 进行了多项增强,包括新增 API、单步运行调试和导入/导出功能。自 v0.13.0 起,RAGFlow 的 Agent 结构已进行重塑以提高可用性。单步运行调试功能完善了这一过程,使得 Agent 工作流中的操作符可以独立执行,从而帮助用户根据输出信息进行调试。
RAG除了混合搜索还需要哪些基础设施能力
Infinity 是一个专为检索增强生成(RAG)设计的数据库,在功能和性能上均表现出色。它为密集向量和稀疏向量搜索以及全文搜索提供了高性能能力,并为这些数据类型提供了高效的范围过滤。此外,它还具有基于张量的重排功能,使得实现强大的多模态 RAG 和集成可与 Cross Encoders 媲美的排序能力成为可能。
使用RAGFlow实现Text2SQL
RAGFlow 响应社区需求,引入了 Text2SQL 功能。传统的 Text2SQL 需要模型微调,这在企业环境中与 RAG 或 Agent 组件一起使用时会显著增加部署和维护成本。RAGFlow 基于 RAG 的 Text2SQL 利用现有的(已连接的)大型语言模型(LLM),无需额外的微调模型即可与其它 RAG/Agent 组件无缝集成。
从 RAG 1.0 到 RAG 2.0,一个轮回?
搜索技术仍然是计算机科学中的主要挑战之一,很少有商业产品能够有效搜索。在大型语言模型(LLM)兴起之前,强大的搜索能力并不被认为是必需的,因为它不直接贡献用户体验。然而,随着 LLM 开始流行,应用 LLM 到企业环境中需要一个强大的内置检索系统。这就是检索增强生成(RAG)——在将内容输入到 LLM 生成最终答案之前,搜索内部知识库以查找与用户查询最相关的内容。
RAGFlow 进入 Agentic 时代
截至 v0.8 版本,RAGFlow 正式进入 Agentic 时代,后端提供了全面的基于图的任务编排框架,前端提供了无代码工作流编辑器。为何选择 Agentic?此功能与现有工作流编排系统有何不同?
Agentic RAG - 定义与低代码实现
朴素 RAG 系统的工作流程可以概括如下:RAG 系统使用用户查询从指定数据源检索,对检索结果进行重排,附加提示,然后将其发送给 LLM 生成最终答案。
然而,在大多数情况下,用户的意图往往是模糊的,需要迭代查询才能生成最终答案。例如,涉及总结多篇文档的问题需要多步推理。这些场景需要 Agentic RAG,它在问答过程中涉及任务编排机制。
Agent 和 RAG 相互补充。顾名思义,Agentic RAG 是基于 agent 的 RAG。 Agentic RAG 和朴素 RAG 的主要区别在于,Agentic RAG 引入了一种动态 agent 编排机制,该机制会评估检索结果,根据每个用户查询的意图重写查询,并采用“多跳”推理来处理复杂的问答任务。