RAG范式发展[一R]检索增强生成(RAG)三大组件🥇检索器(Retriever):从外部数据源(如向量数据库、知识图谱或网页)中搜索与查询相关的信息;🥈增强器(Augmenter):对检索结果进行筛选、排序和整合,提取最相关的片段;🥉生成器(Generator):将增强后的上下文与大模型的预训练知识结合,生成自然语言回答。 [二R]基础范式(Naive RAG)🎖特性:✅索引阶段:文档分块后编码为向量,构建检索库;✅检索阶段:基于相似度匹配前k个相关文本块;✅生成阶段:将检索结果作为上下文输入大模型生成答案。🏅适用:简单问答、事实性查询(如开放域问答)。 [三R]高级范式(Advanced RAG)🏆简介:在基础范式上优化检索效率与生成质量,增加检索前处理(如查询重写)和检索后处理(如重排)。🎖特性:✅检索前增强:通过查询扩展或路径选择缩小语义差异;✅检索后增强:对结果重排序以过滤噪声或冗余信息;✅生成优化:结合压缩或总结技术提升上下文利用率。🏅适用:需要高精度答案的场景(如医疗诊断、法律咨询)。 [四R]模块化范式(Modular RAG)🏆简介:突破传统框架的模块化设计,支持灵活组合功能模块(如多路检索、强化学习)。🎖特性:✅可定制性:根据任务需求集成不同模块(如搜索引擎、多答案融合);✅动态流程:支持迭代检索、自适应检索等复杂策略;✅技术融合:结合微调、知识蒸馏等技术提升性能。🏅适用:复杂多任务场景(如个性化推荐、跨模态生成)。 [五R]图增强范式(Graph RAG)🏆简介:结合知识图谱(KG)技术,强化实体间关系推理,提升检索的语义深度。🎖特性:✅结构化索引:从文本中提取实体与关系构建知识图谱;✅社区检测:识别语义社区以支持全局检索;✅混合检索:同时利用结构化图谱与非结构化文本块。🏅适用:需要全局语义理解的复杂查询(如新闻事件分析、科研文献综述)。 [六R]自主代理范式(Agentic RAG)🏆简介:引入AI代理机制,通过动态决策与迭代优化实现自主式检索生成。🎖特性:✅目标导向:代理根据任务目标主动规划检索路径;✅动态调整:通过反馈循环优化检索策略(如重新查询或调用工具);✅多步推理:支持复杂问题拆解与多轮迭代生成。🏅适用:需长期交互与动态调整的任务(如智能客服、复杂决策支持)。