ai-agents-for-beginners

Agentic RAG

(點擊上方圖片觀看本課程影片)

Agentic RAG

本課程全面介紹了 Agentic 檢索增強生成(Agentic RAG),這是一種新興的 AI 範式,大型語言模型(LLM)能自主規劃下一步行動,同時從外部來源提取資訊。與靜態的「檢索後閱讀」模式不同,Agentic RAG 涉及對 LLM 的迭代調用,穿插工具或函數調用及結構化輸出。系統會評估結果、優化查詢、必要時調用更多工具,並持續此循環直到達到滿意的解決方案。

介紹

本課程涵蓋內容:

學習目標

完成本課程後,你將能了解/掌握:

甚麼是 Agentic RAG?

Agentic 檢索增強生成(Agentic RAG)是一種新興 AI 範式,大型語言模型(LLM)能自主規劃下一步行動,同時從外部來源提取資訊。與靜態的「檢索後閱讀」模式不同,Agentic RAG 涉及對 LLM 反覆調用,穿插工具或函數調用及結構化輸出。系統會評估結果、優化查詢、必要時調用更多工具,持續此循環直至達成滿意方案。這種迭代的「maker-checker」風格提升正確性、處理不規範查詢,並確保高品質結果。

系統積極掌控其推理流程,重寫失敗查詢、選擇不同的檢索方法,並整合多種工具,例如 Azure AI Search 中的向量搜尋、SQL 資料庫或自訂 API,然後才完成最終答案。Agentic 系統的辨識特質是其擁有推理過程的能力。傳統 RAG 實作依賴預定義路徑,Agentic 系統則自主判斷根據所獲資訊的品質決定步驟序列。

定義 Agentic 檢索增強生成 (Agentic RAG)

Agentic 檢索增強生成(Agentic RAG)是 AI 發展中新興的範式,LLM 不僅從外部數據源提取資訊,還自主規劃下一步行動。不同於靜態檢索後閱讀或精心編排的提示序列,Agentic RAG 涉及對 LLM 的迭代循環調用,穿插工具或函數調用及結構化輸出。每一步,系統都會評估所獲結果,決定是否優化查詢,必要時調用額外工具,持續此循環直到達成滿意方案。

這種迭代的「maker-checker」運作風格用於提升正確性、處理不規範的結構化資料庫查詢(如 NL2SQL),並確保均衡且高品質的結果。系統並非僅依賴精密設計的提示鏈,而是主動掌控推理流程。它能重寫失敗的查詢、選擇不同檢索方法,並整合多種工具(如 Azure AI Search 向量搜尋、SQL 資料庫或自訂 API)後再給出最終答案。這省卻複雜的協調框架,只需相對簡單的「LLM 呼叫 → 工具使用 → LLM 呼叫 → …」循環即可產出精準且有根據的結果。

Agentic RAG Core Loop

掌控推理過程

使系統成為「agentic」的關鍵特質是其擁有推理過程的能力。傳統 RAG 通常依賴人類預先定義模型路徑:一條描述何時檢索及檢索何物的思考鏈。 但當系統真正具有 agentic 性質時,它會在內部決定如何處理問題,而不是僅僅執行指令腳本;它自主判斷根據資訊品質決定步驟序列。 例如,當要求它制定產品發布策略時,系統不會僅依賴一個詳細說明整個研究與決策流程的提示語,而是 agentic 模型會自主決定:

  1. 使用 Bing 網絡檢索取得當前市場趨勢報告
  2. 利用 Azure AI Search 識別相關競爭者資料
  3. 使用 Azure SQL 資料庫關聯歷史內部銷售指標
  4. 透過 Azure OpenAI 服務將發現結果綜合為連貫策略
  5. 評估策略中的漏洞或不一致性,必要時再次檢索

這些步驟—優化查詢、選擇來源、迭代直到對答案「滿意」—皆由模型決定,而非人類預先編寫。

迭代循環、工具整合與記憶

Tool Integration Architecture

Agentic 系統依賴循環的互動模式:

隨著時間推移,系統能演化理解,幫助模型在複雜多步任務中導航,而無須人類不斷干預或重塑提示。

處理失敗模式與自我修正

Agentic RAG 的自治性同時包括健全的自我修正機制。當系統遇到困境——例如檢索出不相關文件或遭遇錯誤查詢時——它可以:

這種迭代且動態的策略讓模型持續改進,確保它不只是一次性系統,而是在同一回合中從失誤中學習。

Self Correction Mechanism

代理範圍界限

儘管在任務中具有自治性,Agentic RAG 並不等同於通用人工智能。其「agentic」能力侷限於人類開發者提供的工具、資料源和政策。它無法自行創造工具或超越既定領域範圍,而是擅長動態協調現有資源。 與更高階 AI 的主要差異包括:

  1. 領域專屬自治: Agentic RAG 系統專注於在已知領域內達成用戶指定目標,運用查詢重寫或工具選擇策略以改善結果。
  2. 基礎設施依賴: 系統能力依賴開發者所整合的工具與資料,無法無人干預地突破這些限制。
  3. 尊重保護措施: 道德準則、合規規則與業務政策極為重要。代理自由度始終受限於安全與監督機制(這點仍充滿希望?)

實際使用案例與價值

Agentic RAG 擅長需要反覆優化與精確度的場景:

  1. 優先正確性環境: 在合規檢查、監管分析或法律研究中,代理模型可反覆驗證事實、諮詢多方資料源,並重寫查詢,直至產出全面核查的答案。
  2. 複雜資料庫互動: 面對結構化資料,查詢經常失敗或需調整,系統可自動優化 Azure SQL 或 Microsoft Fabric OneLake 查詢,確保最終檢索符合用戶需求。
  3. 延伸工作流程: 長時間會話可能因新資訊浮現而演進。Agentic RAG 可持續整合新資料,隨著對問題空間的理解深化而調整策略。

治理、透明與信任

隨著系統越來越能自主推理,治理與透明變得至關重要:

具備清晰操作紀錄的工具至關重要。缺乏此類工具時,除錯多步流程將非常困難。以下範例來自 Literal AI(Chainlit 背後公司)的代理執行示例:

AgentRunExample

結論

Agentic RAG 代表了 AI 處理複雜資料密集型任務的一種自然演進。透過採用迴圈式互動模式、自主選擇工具、優化查詢直至達成高品質成果,系統突破了靜態提示驅動的限制,成為更具適應性與情境感知的決策者。雖然仍受限於人類定義的基礎設施與道德規範,但這些 agentic 能力使 AI 與企業及最終用戶的互動更豐富、更動態,且更具實用價值。

對 Agentic RAG 有更多疑問?

加入 Microsoft Foundry Discord,與其他學習者交流,參加辦公時間並解答你的 AI 代理問題。

額外資源

學術論文

前一課

工具使用設計模式

下一課

構建可信賴的 AI 代理


免責聲明
本文件乃使用人工智能翻譯服務 Co-op Translator 進行翻譯。雖然我們致力於確保準確性,但請注意,自動翻譯可能存在錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於重要資訊,建議採用專業人工翻譯。本公司對因使用本翻譯而產生的任何誤解或誤譯不承擔任何責任。