PaperAgent 01月19日
一篇Agentic RAG全栈技术最新综述
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

2025年RAG技术以Agentic RAG新范式得到更广泛应用,文章回顾RAG发展历程,详细探讨Agentic RAG的多种框架及特点

RAG技术发展历程,从Naïve RAG到Advanced RAG等,每种范式各有优劣

Agentic RAG实现范式转变,如Single-Agent等多种架构,具有不同特点及工作流程

Corrective RAG等具有独特机制,如自我纠正检索结果以提高回答质量

2025-01-17 14:58 湖北

5种RAG范式,7大类Agentic RAG框架

2025年RAG技术并不会消亡,而是以新的范式 Agentic RAG 得到更广泛、深入应用,2025新鲜出炉的Agentic RAG全栈技术综述:

RAG的发展历程 

Naïve RAG

Naïve RAG是检索增强生成的基础实现,它侧重于基于关键词的检索和静态数据集。

这些系统依赖于简单的关键词检索技术,如TF-IDF和BM25,从静态数据集中获取文档。检索到的文档用于增强语言模型的生成能力。Naïve RAG的特点包括简单易实现,适用于涉及基于事实的查询且上下文复杂性较低的任务。然而,它存在以下局限性:

尽管存在这些局限性,Naïve RAG系统为将检索与生成相结合提供了关键的概念验证,为更复杂的范式奠定了基础。

Advanced RAG

Advanced RAG系统在Naïve RAG的基础上进行了改进,引入了语义理解和增强的检索技术。这些系统利用密集检索模型(如Dense Passage Retrieval, DPR)和神经排序算法来提高检索精度。

Advanced RAG的关键特点包括:

这些进步使Advanced RAG适用于需要高精度和细腻理解的应用,如研究综合和个性化推荐。然而,计算开销大和可扩展性有限等挑战依然存在,特别是在处理大型数据集或多步查询时。

Modular RAG

Modular RAG是RAG范式的最新演变,强调灵活性和定制化。这些系统将检索和生成流程分解为独立、可重用的组件,实现了针对特定领域的优化和任务适应性。Modular RAG展示了混合检索策略、可组合的流程和外部工具集成。

Modular RAG的关键创新包括:

例如,为金融分析设计的Modular RAG系统可能通过API检索实时股票价格,使用密集检索分析历史趋势,并通过定制的语言模型生成可操作的投资见解。这种模块化和定制化使Modular RAG成为复杂、多领域任务的理想选择,提供了可扩展性和精确性。

Graph RAG

Graph RAG通过整合基于图的数据结构扩展了传统的检索增强生成系统,这些系统利用图数据中的关系和层次结构,增强了多跳推理和上下文丰富性。通过引入基于图的检索,Graph RAG能够实现更丰富、更准确的生成输出,特别是在需要关系理解的任务中。

Graph RAG的特点包括:

然而,Graph RAG也有一些局限性:

Graph RAG适用于医疗诊断、法律研究等需要对结构化关系进行推理的应用领域。

Agentic RAG

Agentic RAG通过引入能够进行动态决策和工作流程优化的自主代理,实现了范式转变。与静态系统不同,Agentic RAG采用迭代细化和自适应检索策略,以应对复杂、实时和多域查询。这一范式利用检索和生成过程的模块化,同时引入基于代理的自主性。

Agentic RAG系统

Single-Agent Agentic RAG:路由器

单智能体Agentic RAG系统作为一个集中的决策系统,其中单一Agent管理信息的检索、路由和整合。这种架构通过将这些任务整合到一个统一的Agent中,简化了系统,特别适用于工具或数据源数量有限的设置。

工作流程:

    查询提交和评估:用户提交查询,协调代理(或主检索代理)接收查询并分析以确定最合适的信息源。

    知识源选择:根据查询类型,协调代理从多种检索选项中选择:

数据整合和LLM合成:从选定源检索到的相关数据传递给大型语言模型(LLM)。LLM合成收集的信息,将多个来源的见解整合成连贯且上下文相关的回答。

输出生成:系统最终生成一个全面的、面向用户的答案,以解决原始查询。此回答以可操作、简洁的格式呈现,可能包括对使用源的引用或引用。

Multi-Agent Agentic RAG

多智能体RAG系统是单智能体架构的模块化和可扩展演变,通过利用多个专门的代理来处理复杂工作流程和多样化的查询类型。与依赖单一智能体管理所有任务(推理、检索和回答生成)不同,此系统将责任分配给多个智能体,每个智能体针对特定角色或数据源进行优化。

工作流程:

    查询提交:用户查询被协调代理或主检索代理接收。此代理作为中央协调器,根据查询要求将查询委托给专门的检索代理。

    专门检索代理:查询在多个检索代理之间分配,每个代理专注于特定类型的数据源或任务。例如:

工具访问和数据检索:每个代理将其查询路由到其域内的适当工具或数据源,例如:

数据整合和LLM合成:检索完成后,所有代理的数据传递给大型语言模型(LLM)。LLM将检索到的信息合成连贯且上下文相关的回答,无缝整合多个来源的见解。

输出生成:系统生成一个全面的回答,以可操作且简洁的格式返回给用户。

层次化 Agentic RAG

层次化Agentic RAG系统采用结构化的多层次方法进行信息检索和处理,增强效率和战略决策制定。代理按层次结构组织,高级代理监督和指导低级代理。这种结构实现了多级决策,确保查询由最合适的资源处理。

工作流程:

    查询接收:用户提交查询,由顶级代理接收,负责初步评估和委派。

    战略决策制定:顶级代理评估查询的复杂性,并决定优先考虑哪些下属代理或数据源。根据查询的领域,某些数据库、API或检索工具可能被认为更可靠或相关。

    委派给下属代理:顶级代理将任务分配给专门于特定检索方法的低级代理(例如,SQL数据库、网络搜索或专有系统)。这些代理独立执行其分配的任务。

    聚合和合成:下属代理的结果由高级代理收集和整合,该代理将信息合成连贯的回答。

    回答交付:最终合成的答案返回给用户,确保回答既全面又上下文相关。

Agentic Corrective RAG

Corrective RAG引入了自我纠正检索结果的机制,增强文档利用并提高回答生成质量。通过将智能代理嵌入工作流程,Corrective RAG确保迭代细化上下文文档和回答,最小化错误并最大化相关性。

Corrective RAG的核心理念:Corrective RAG的核心原则在于其能够动态评估检索到的文档,执行纠正措施,并细化查询以提高生成回答的质量。Corrective RAG调整其方法如下:

工作流程:Corrective RAG系统基于五个关键代理构建:

    上下文检索代理:负责从向量数据库中检索初始上下文文档。

    相关性评估代理:评估检索到的文档的相关性,并标记任何不相关或模糊的文档以进行纠正措施。

    查询细化代理:重写查询以提高检索的特异性和相关性,利用语义理解来优化结果。

    外部知识检索代理:当上下文文档不足时,执行网络搜索或访问替代数据源。

    回答合成代理:将所有经过验证的信息整合成连贯且准确的回答。

自适应Agentic  RAG

自适应检索增强生成(Adaptive RAG)通过根据传入查询的复杂性动态调整查询处理策略,增强了大型语言模型(LLMs)的灵活性和效率。与静态检索工作流程不同,Adaptive RAG使用分类器评估查询复杂性,并确定最适当的方法,范围从单步检索到多步推理,甚至对于简单查询直接跳过检索。

Adaptive RAG的核心理念:Adaptive RAG的核心原则在于其能够根据查询的复杂性动态调整检索策略。Adaptive RAG调整其方法如下:

工作流程:Adaptive RAG系统基于三个主要组件构建:

    分类器角色

动态策略选择

LLM整合

基于图的Agentic  RAG

Agent-G引入了一种新颖的代理架构,将图知识库与非结构化文档检索相结合。通过结合结构化和非结构化数据源,该框架增强了检索增强生成(RAG)系统,提高了推理和检索精度。它采用模块化检索器库、动态代理交互和反馈循环,以确保高质量输出。

Agent-G的核心理念:Agent-G的核心原则在于其能够动态地将检索任务分配给专门的代理,利用图知识库和文本文档。Agent-G调整其检索策略如下:

工作流程:Agent-G系统基于四个主要组件构建:

    检索器库

批评模块

动态代理交互

LLM整合

Agentic文档工作流

智能体文档工作流(Agentic Document Workflows, ADW)扩展了传统的检索增强生成(RAG)范式,实现了端到端的知识工作自动化。这些工作流协调复杂的以文档为中心的过程,整合文档解析、检索、推理和结构化输出与智能代理。ADW系统通过维护状态、协调多步工作流,并将领域特定逻辑应用于文档,解决了智能文档处理(IDP)和RAG的限制。

工作流程:

    文档解析和信息结构化

跨流程的状态维护

知识检索

代理协调

可操作输出生成

传统RAG与Agentic RAG与Agentic文档工作流(ADW)对比

https://arxiv.org/abs/2501.09136Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG

推荐阅读


欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

RAG技术 Agentic RAG 发展历程 工作流程 自我纠正
相关文章