ai-agents-for-beginners

Agentic RAG

(点击上方图片观看本课视频)

代理式RAG

本课全面介绍了代理式检索增强生成(Agentic RAG),这是一种新兴的AI范式,在该范式下,大型语言模型(LLMs)能够自主规划下一步操作,同时从外部来源获取信息。不同于静态的先检索后阅读模式,代理式RAG涉及对LLM的迭代调用,穿插工具或函数调用及结构化输出。系统评估结果、优化查询、在必要时调用额外工具,并持续循环直到获得满意的解决方案。

介绍

本课将涵盖

学习目标

完成本课后,你将了解/掌握:

什么是代理式RAG?

代理式检索增强生成(Agentic RAG)是一种新兴的AI范式,在此范式中,大型语言模型(LLMs)能够自主规划下一步操作,同时从外部来源获取信息。与静态的先检索后阅读模式不同,代理式RAG中,LLM通过迭代调用,穿插工具或函数调用及结构化输出。系统对结果进行评估,优化查询,必要时调用额外工具,并不断循环直到达到满意的解决方案。这种迭代的“制作者-检查者”模式提升了准确性,处理了格式错误的查询,确保高质量结果。

系统主动掌控推理流程,重写失败的查询、选择不同的检索方法、整合多种工具——如Azure AI Search的向量搜索、SQL数据库或自定义API——然后确定最终答案。代理式系统的显著特质是其对推理过程的自主掌控。传统RAG实现依赖预定义路径,而代理系统根据找到的信息质量自主决定步骤顺序。

代理式检索增强生成(Agentic RAG)定义

代理式检索增强生成(Agentic RAG)是一种AI开发中新兴的范式,在此范式中,LLM不仅从外部数据源提取信息,还能自主规划下一步。不同于静态的先检索后读模式或精心编写的提示序列,代理式RAG包含一个迭代调用LLM的循环,穿插工具或函数调用及结构化输出。每一步系统评估取得的结果,决定是否优化查询,必要时调用额外工具,持续循环直至获得满意解决方案。

这种迭代的“制作者-检查者”操作模式设计用于提升正确性,处理结构化数据库中格式错误的查询(如NL2SQL),确保平衡且高质量的结果。系统主动掌控推理过程,能重写失败查询,选择不同检索方法,整合多种工具——如Azure AI Search中的向量搜索、SQL数据库或自定义API——最终确定答案。这样免去了过于复杂的编排框架,简单的“LLM调用→使用工具→再次调用LLM→…”循环即可产出复杂且有根有据的输出。

Agentic RAG Core Loop

掌控推理过程

让系统“代理式”的关键品质,是其掌控推理过程的能力。传统RAG实现往往依赖人类预先定义模型路径:一个描述了何时及如何检索的思路链。但真正的代理系统会自主决定如何解决问题。它不仅仅是在执行脚本,而是基于获取信息的质量自主确定步骤顺序。 举例来说,当被要求制定产品发布策略时,它不会单纯依赖提示中完整的研究和决策流程。相反,代理模型独立决定:

  1. 使用Bing网页检索获取当前市场趋势报告
  2. 利用Azure AI Search识别相关竞争对手数据
  3. 通过Azure SQL数据库关联历史内部销售指标
  4. 结合Azure OpenAI服务综合分析结果形成整体策略
  5. 评估策略是否存在缺口或不一致,并在必要时进行下一轮检索 所有这些步骤——查询优化、选择信息源、迭代直至“满意”答案——均由模型自主决策,而非人工预设脚本。

迭代循环、工具整合与记忆

Tool Integration Architecture

代理系统依赖循环互动模式:

随着时间推移,模型对任务理解逐渐深化,能够处理复杂多步骤任务,无需人工反复干预或重塑提示。

处理失败模式与自我纠正

代理式RAG的自主性还体现在强大的自我纠正机制上。当系统遇到死胡同——如检索到无关文件或处理格式错误的查询——它能:

这种迭代动态方法使模型不断改进,既非一次性系统,而是在会话中从错误中学习。

Self Correction Mechanism

代理的边界

尽管任务中具有自主性,代理式RAG并不等同于通用人工智能。其“代理”能力受限于开发者提供的工具、数据源和策略。它不能自行发明工具或突破设定的领域边界,而是擅长动态编排现有资源。 与更高级AI形式的主要区别包括:

  1. 领域特定自主性: 代理式RAG系统聚焦于在已知领域内实现用户定义目标,使用如查询重写或工具选择等策略提升结果。
  2. 基础设施依赖: 系统能力依赖开发者整合的工具和数据,无法无人工干预跨越这些界限。
  3. 遵守防护措施: 道德规范、合规规则和业务政策极为重要。代理的自由始终受限于安全措施和监管机制(希望如此?)

实际使用案例与价值

代理式RAG在需要迭代优化和精准性的场景中表现出色:

  1. 优先正确性环境: 如合规检查、监管分析或法律研究,代理模型可反复验证事实,咨询多方来源,重写查询直至给出充分审查答案。
  2. 复杂数据库交互: 处理结构化数据时,查询常常失败或需调整,系统能自主用Azure SQL或Microsoft Fabric OneLake细化查询,确保最终检索符合用户意图。
  3. 延伸工作流程: 长时会话可能随着新信息出现不断演变。代理式RAG可持续融合新数据,随着对问题域理解深入调整策略。

治理、透明度与信任

随着系统推理自主性增强,治理与透明度尤为关键:

具备能清晰记录操作的工具至关重要,缺失这些工具,调试多步骤过程将极为困难。以下示例来自Literal AI(Chainlit背后的公司),展示一次代理运行:

AgentRunExample

结论

代理式RAG代表了AI系统处理复杂数据密集任务的自然演进。通过采用循环交互模式,自主选择工具,优化查询直至达到高质量结果,系统超越了静态提示跟随,成为更具适应性、且具上下文感知的决策者。虽然仍受限于人类定义的基础设施和伦理准则,这些代理能力使得企业和终端用户获得更加丰富、动感与实用的AI交互体验。

关于代理式RAG还有更多疑问?

加入 Microsoft Foundry Discord,与其他学习者交流,参加答疑时间,获得有关AI代理的解答。

附加资源

学术论文

先前课程

工具使用设计模式

下一课程

构建可信赖的 AI 代理


免责声明
本文件使用人工智能翻译服务 Co-op Translator 翻译。尽管我们力求准确,但请注意自动翻译可能存在错误或不准确之处。原始的母语文档应被视为权威来源。对于重要信息,建议采用专业人工翻译。我们不对因使用本翻译而产生的任何误解或误释承担责任。