
(點擊上方圖片觀看本課程影片)
Agentic RAG
本課程全面介紹了「Agentic Retrieval-Augmented Generation (Agentic RAG)」,這是一種新興的人工智能範式,讓大型語言模型 (LLMs) 能夠自主規劃下一步行動,同時從外部資源中提取信息。與靜態的「檢索後閱讀」模式不同,Agentic RAG 涉及到 LLM 的多次迭代調用,並穿插工具或函數調用以及結構化輸出。系統會評估結果、改進查詢、在必要時調用額外工具,並持續這一循環直到達成滿意的解決方案。
課程介紹
本課程將涵蓋以下內容:
- 了解 Agentic RAG: 探索人工智能中的新興範式,讓大型語言模型 (LLMs) 能夠自主規劃下一步行動,同時從外部數據源中提取信息。
- 掌握迭代的 Maker-Checker 模式: 理解 LLM 的迭代調用循環,穿插工具或函數調用以及結構化輸出,旨在提高正確性並處理不良查詢。
- 探索實際應用: 確定 Agentic RAG 的適用場景,例如以正確性為優先的環境、複雜的數據庫交互以及延展的工作流程。
學習目標
完成本課程後,您將能夠了解以下內容:
- 理解 Agentic RAG: 探索人工智能中的新興範式,讓大型語言模型 (LLMs) 能夠自主規劃下一步行動,同時從外部數據源中提取信息。
- 迭代的 Maker-Checker 模式: 掌握 LLM 的迭代調用循環,穿插工具或函數調用以及結構化輸出,旨在提高正確性並處理不良查詢。
- 掌控推理過程: 理解系統如何掌控其推理過程,決定解決問題的方式,而不依賴預定的路徑。
- 工作流程: 了解 agentic 模型如何自主決定檢索市場趨勢報告、識別競爭者數據、關聯內部銷售指標、綜合分析結果並評估策略。
- 迭代循環、工具整合與記憶: 學習系統如何依賴循環交互模式,跨步驟保持狀態和記憶,避免重複循環並做出明智決策。
- 處理失敗模式與自我修正: 探索系統的強大自我修正機制,包括迭代和重新查詢、使用診斷工具以及依賴人工監督。
- 自主性的界限: 理解 Agentic RAG 的局限性,聚焦於特定領域的自主性、基礎設施依賴以及遵守安全規範。
- 實際應用場景與價值: 確定 Agentic RAG 的適用場景,例如以正確性為優先的環境、複雜的數據庫交互以及延展的工作流程。
- 治理、透明度與信任: 學習治理和透明度的重要性,包括可解釋的推理、偏差控制以及人工監督。
什麼是 Agentic RAG?
Agentic Retrieval-Augmented Generation (Agentic RAG) 是一種新興的人工智能範式,讓大型語言模型 (LLMs) 能夠自主規劃下一步行動,同時從外部資源中提取信息。與靜態的「檢索後閱讀」模式不同,Agentic RAG 涉及到 LLM 的多次迭代調用,並穿插工具或函數調用以及結構化輸出。系統會評估結果、改進查詢、在必要時調用額外工具,並持續這一循環直到達成滿意的解決方案。
這種迭代的「Maker-Checker」操作模式旨在提高正確性、處理結構化數據庫(例如 NL2SQL)的不良查詢,並確保平衡且高質量的結果。系統不僅依賴精心設計的提示鏈,還能主動掌控其推理過程。它可以重寫失敗的查詢、選擇不同的檢索方法,並整合多種工具,例如 Azure AI Search 的向量搜索、SQL 數據庫或自定義 API,然後再最終確定答案。這消除了對過於複雜的編排框架的需求。相反,一個相對簡單的「LLM 調用 → 工具使用 → LLM 調用 → …」循環即可產生複雜且有根據的輸出。

掌控推理過程
使系統具有「agentic」特質的區別在於其掌控推理過程的能力。傳統的 RAG 實現通常依賴人類預先定義模型的路徑:一個思維鏈,概述需要檢索的內容以及檢索的時間。
但當系統真正具有 agentic 特質時,它能內部決定如何解決問題。它不僅僅執行腳本,而是根據所獲得信息的質量自主決定步驟的順序。
例如,當被要求制定產品發布策略時,它不僅僅依賴一個提示來詳細說明整個研究和決策工作流程。相反,agentic 模型會自主決定:
- 使用 Bing Web Grounding 檢索當前市場趨勢報告。
- 使用 Azure AI Search 識別相關競爭者數據。
- 使用 Azure SQL Database 關聯歷史內部銷售指標。
- 通過 Azure OpenAI Service 綜合分析結果形成連貫的策略。
- 評估策略是否存在漏洞或不一致,必要時進行另一輪檢索。
所有這些步驟——改進查詢、選擇資源、迭代直到對答案「滿意」——均由模型決定,而非由人類預先編寫腳本。
迭代循環、工具整合與記憶

Agentic 系統依賴於循環交互模式:
- 初始調用: 用戶的目標(即用戶提示)被呈現給 LLM。
- 工具調用: 如果模型識別出信息缺失或指令模糊,它會選擇工具或檢索方法,例如向量數據庫查詢(例如 Azure AI Search Hybrid search 對私有數據進行搜索)或結構化 SQL 調用,以獲取更多上下文。
- 評估與改進: 在審查返回的數據後,模型決定信息是否足夠。如果不足,它會改進查詢、嘗試不同工具或調整方法。
- 重複直到滿意: 此循環持續進行,直到模型認為已經有足夠的清晰度和證據來提供最終的、經過充分推理的回應。
- 記憶與狀態: 由於系統在各步驟中保持狀態和記憶,它能回憶之前的嘗試及其結果,避免重複循環並在過程中做出更明智的決策。
隨著時間的推移,這種方式創造了一種逐步理解的感覺,使模型能夠在不需要人類不斷干預或重塑提示的情況下,完成複雜的多步驟任務。
處理失敗模式與自我修正
Agentic RAG 的自主性還包括強大的自我修正機制。當系統遇到瓶頸,例如檢索到無關文件或遇到不良查詢時,它可以:
- 迭代和重新查詢: 模型不會返回低價值的回應,而是嘗試新的搜索策略、重寫數據庫查詢或查看替代數據集。
- 使用診斷工具: 系統可能調用額外的函數,幫助其調試推理步驟或確認檢索數據的正確性。像 Azure AI Tracing 這樣的工具將對實現強大的可觀察性和監控非常重要。
- 依賴人工監督: 對於高風險或反覆失敗的場景,模型可能會標記不確定性並請求人工指導。一旦人類提供了糾正性反饋,模型可以在後續過程中吸收這些教訓。
這種迭代和動態的方法使模型能夠持續改進,確保它不僅僅是一個一次性系統,而是一個能在特定會話中從失誤中學習的系統。

自主性的界限
儘管在任務中具有自主性,Agentic RAG 並不等同於人工通用智能。其「agentic」能力僅限於人類開發者提供的工具、數據源和政策。它無法自行創建工具或超越設定的領域邊界。相反,它擅長於動態編排現有資源。
與更高級的人工智能形式相比,主要差異包括:
- 特定領域的自主性: Agentic RAG 系統專注於在已知領域內實現用戶定義的目標,採用查詢重寫或工具選擇等策略來改善結果。
- 基礎設施依賴: 系統的能力取決於開發者整合的工具和數據。它無法在沒有人工干預的情況下超越這些邊界。
- 遵守安全規範: 道德準則、合規規則和業務政策仍然非常重要。代理的自由度始終受到安全措施和監督機制的約束(希望如此?)。
實際應用場景與價值
Agentic RAG 在需要迭代改進和精確性的場景中表現出色:
- 以正確性為優先的環境: 在合規檢查、監管分析或法律研究中,agentic 模型可以反覆驗證事實、查詢多個來源並重寫查詢,直到生成經過充分審核的答案。
- 複雜的數據庫交互: 在處理結構化數據時,查詢可能經常失敗或需要調整,系統可以使用 Azure SQL 或 Microsoft Fabric OneLake 自主改進查詢,確保最終檢索符合用戶意圖。
- 延展的工作流程: 隨著新信息的出現,長時間運行的會話可能會演變。Agentic RAG 可以持續整合新數據,隨著對問題空間的了解加深而調整策略。
治理、透明度與信任
隨著這些系統在推理中變得更加自主,治理和透明度至關重要:
- 可解釋的推理: 模型可以提供其所做查詢、所檢索來源以及其推理步驟的審計記錄。像 Azure AI Content Safety 和 Azure AI Tracing / GenAIOps 這樣的工具可以幫助保持透明度並降低風險。
- 偏差控制與平衡檢索: 開發者可以調整檢索策略,確保考慮平衡且具有代表性的數據來源,並定期審核輸出以檢測偏差或不平衡模式,使用 Azure Machine Learning 的自定義模型為高級數據科學組織提供支持。
- 人工監督與合規: 對於敏感任務,人工審查仍然必不可少。Agentic RAG 並不取代人類在高風險決策中的判斷,而是通過提供經過充分審核的選項來輔助人類。
擁有能夠提供清晰行動記錄的工具至關重要。沒有這些工具,調試多步驟過程可能會非常困難。以下是 Literal AI(Chainlit 背後的公司)提供的一個代理運行示例:

結論
Agentic RAG 代表了人工智能系統在處理複雜且數據密集型任務方面的自然演進。通過採用循環交互模式、自主選擇工具以及改進查詢直到達成高質量結果,系統超越了靜態的提示跟隨,成為更具適應性和上下文感知的決策者。儘管仍然受限於人類定義的基礎設施和道德準則,這些 agentic 能力使企業和終端用戶能夠享受更豐富、更動態且更有價值的人工智能交互。
對 Agentic RAG 有更多疑問?
加入 Azure AI Foundry Discord,與其他學習者交流,參加辦公時間並解答您的 AI Agents 問題。
其他資源
學術論文
上一課
工具使用設計模式
下一課
構建值得信賴的 AI 代理
免責聲明:
本文件已使用人工智能翻譯服務 Co-op Translator 進行翻譯。儘管我們致力於提供準確的翻譯,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於重要信息,建議使用專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或錯誤解釋概不負責。