ai-agents-for-beginners

(點擊上方圖片觀看本課程影片)

Agentic RAG

本課程全面介紹了「Agentic Retrieval-Augmented Generation (Agentic RAG)」，這是一種新興的人工智能範式，讓大型語言模型 (LLMs) 能夠自主規劃下一步行動，同時從外部資源中提取信息。與靜態的「檢索後閱讀」模式不同，Agentic RAG 涉及到 LLM 的多次迭代調用，並穿插工具或函數調用以及結構化輸出。系統會評估結果、改進查詢、在必要時調用額外工具，並持續這一循環直到達成滿意的解決方案。

課程介紹

本課程將涵蓋以下內容：

了解 Agentic RAG： 探索人工智能中的新興範式，讓大型語言模型 (LLMs) 能夠自主規劃下一步行動，同時從外部數據源中提取信息。
掌握迭代的 Maker-Checker 模式： 理解 LLM 的迭代調用循環，穿插工具或函數調用以及結構化輸出，旨在提高正確性並處理不良查詢。
探索實際應用： 確定 Agentic RAG 的適用場景，例如以正確性為優先的環境、複雜的數據庫交互以及延展的工作流程。

學習目標

完成本課程後，您將能夠了解以下內容：

理解 Agentic RAG： 探索人工智能中的新興範式，讓大型語言模型 (LLMs) 能夠自主規劃下一步行動，同時從外部數據源中提取信息。
迭代的 Maker-Checker 模式： 掌握 LLM 的迭代調用循環，穿插工具或函數調用以及結構化輸出，旨在提高正確性並處理不良查詢。
掌控推理過程： 理解系統如何掌控其推理過程，決定解決問題的方式，而不依賴預定的路徑。
工作流程： 了解 agentic 模型如何自主決定檢索市場趨勢報告、識別競爭者數據、關聯內部銷售指標、綜合分析結果並評估策略。
迭代循環、工具整合與記憶： 學習系統如何依賴循環交互模式，跨步驟保持狀態和記憶，避免重複循環並做出明智決策。
處理失敗模式與自我修正： 探索系統的強大自我修正機制，包括迭代和重新查詢、使用診斷工具以及依賴人工監督。
自主性的界限： 理解 Agentic RAG 的局限性，聚焦於特定領域的自主性、基礎設施依賴以及遵守安全規範。
實際應用場景與價值： 確定 Agentic RAG 的適用場景，例如以正確性為優先的環境、複雜的數據庫交互以及延展的工作流程。
治理、透明度與信任： 學習治理和透明度的重要性，包括可解釋的推理、偏差控制以及人工監督。

什麼是 Agentic RAG？

Agentic Retrieval-Augmented Generation (Agentic RAG) 是一種新興的人工智能範式，讓大型語言模型 (LLMs) 能夠自主規劃下一步行動，同時從外部資源中提取信息。與靜態的「檢索後閱讀」模式不同，Agentic RAG 涉及到 LLM 的多次迭代調用，並穿插工具或函數調用以及結構化輸出。系統會評估結果、改進查詢、在必要時調用額外工具，並持續這一循環直到達成滿意的解決方案。

這種迭代的「Maker-Checker」操作模式旨在提高正確性、處理結構化數據庫（例如 NL2SQL）的不良查詢，並確保平衡且高質量的結果。系統不僅依賴精心設計的提示鏈，還能主動掌控其推理過程。它可以重寫失敗的查詢、選擇不同的檢索方法，並整合多種工具，例如 Azure AI Search 的向量搜索、SQL 數據庫或自定義 API，然後再最終確定答案。這消除了對過於複雜的編排框架的需求。相反，一個相對簡單的「LLM 調用 → 工具使用 → LLM 調用 → …」循環即可產生複雜且有根據的輸出。

Agentic RAG 核心循環

掌控推理過程

使系統具有「agentic」特質的區別在於其掌控推理過程的能力。傳統的 RAG 實現通常依賴人類預先定義模型的路徑：一個思維鏈，概述需要檢索的內容以及檢索的時間。但當系統真正具有 agentic 特質時，它能內部決定如何解決問題。它不僅僅執行腳本，而是根據所獲得信息的質量自主決定步驟的順序。例如，當被要求制定產品發布策略時，它不僅僅依賴一個提示來詳細說明整個研究和決策工作流程。相反，agentic 模型會自主決定：

使用 Bing Web Grounding 檢索當前市場趨勢報告。
使用 Azure AI Search 識別相關競爭者數據。
使用 Azure SQL Database 關聯歷史內部銷售指標。
通過 Azure OpenAI Service 綜合分析結果形成連貫的策略。
評估策略是否存在漏洞或不一致，必要時進行另一輪檢索。所有這些步驟——改進查詢、選擇資源、迭代直到對答案「滿意」——均由模型決定，而非由人類預先編寫腳本。

迭代循環、工具整合與記憶

工具整合架構

Agentic 系統依賴於循環交互模式：

初始調用： 用戶的目標（即用戶提示）被呈現給 LLM。
工具調用： 如果模型識別出信息缺失或指令模糊，它會選擇工具或檢索方法，例如向量數據庫查詢（例如 Azure AI Search Hybrid search 對私有數據進行搜索）或結構化 SQL 調用，以獲取更多上下文。
評估與改進： 在審查返回的數據後，模型決定信息是否足夠。如果不足，它會改進查詢、嘗試不同工具或調整方法。
重複直到滿意： 此循環持續進行，直到模型認為已經有足夠的清晰度和證據來提供最終的、經過充分推理的回應。
記憶與狀態： 由於系統在各步驟中保持狀態和記憶，它能回憶之前的嘗試及其結果，避免重複循環並在過程中做出更明智的決策。

隨著時間的推移，這種方式創造了一種逐步理解的感覺，使模型能夠在不需要人類不斷干預或重塑提示的情況下，完成複雜的多步驟任務。

處理失敗模式與自我修正

Agentic RAG 的自主性還包括強大的自我修正機制。當系統遇到瓶頸，例如檢索到無關文件或遇到不良查詢時，它可以：

迭代和重新查詢： 模型不會返回低價值的回應，而是嘗試新的搜索策略、重寫數據庫查詢或查看替代數據集。
使用診斷工具： 系統可能調用額外的函數，幫助其調試推理步驟或確認檢索數據的正確性。像 Azure AI Tracing 這樣的工具將對實現強大的可觀察性和監控非常重要。
依賴人工監督： 對於高風險或反覆失敗的場景，模型可能會標記不確定性並請求人工指導。一旦人類提供了糾正性反饋，模型可以在後續過程中吸收這些教訓。

這種迭代和動態的方法使模型能夠持續改進，確保它不僅僅是一個一次性系統，而是一個能在特定會話中從失誤中學習的系統。

自我修正機制

自主性的界限

儘管在任務中具有自主性，Agentic RAG 並不等同於人工通用智能。其「agentic」能力僅限於人類開發者提供的工具、數據源和政策。它無法自行創建工具或超越設定的領域邊界。相反，它擅長於動態編排現有資源。與更高級的人工智能形式相比，主要差異包括：

特定領域的自主性： Agentic RAG 系統專注於在已知領域內實現用戶定義的目標，採用查詢重寫或工具選擇等策略來改善結果。
基礎設施依賴： 系統的能力取決於開發者整合的工具和數據。它無法在沒有人工干預的情況下超越這些邊界。
遵守安全規範： 道德準則、合規規則和業務政策仍然非常重要。代理的自由度始終受到安全措施和監督機制的約束（希望如此？）。

實際應用場景與價值

Agentic RAG 在需要迭代改進和精確性的場景中表現出色：

以正確性為優先的環境： 在合規檢查、監管分析或法律研究中，agentic 模型可以反覆驗證事實、查詢多個來源並重寫查詢，直到生成經過充分審核的答案。
複雜的數據庫交互： 在處理結構化數據時，查詢可能經常失敗或需要調整，系統可以使用 Azure SQL 或 Microsoft Fabric OneLake 自主改進查詢，確保最終檢索符合用戶意圖。
延展的工作流程： 隨著新信息的出現，長時間運行的會話可能會演變。Agentic RAG 可以持續整合新數據，隨著對問題空間的了解加深而調整策略。

治理、透明度與信任

隨著這些系統在推理中變得更加自主，治理和透明度至關重要：

可解釋的推理： 模型可以提供其所做查詢、所檢索來源以及其推理步驟的審計記錄。像 Azure AI Content Safety 和 Azure AI Tracing / GenAIOps 這樣的工具可以幫助保持透明度並降低風險。
偏差控制與平衡檢索： 開發者可以調整檢索策略，確保考慮平衡且具有代表性的數據來源，並定期審核輸出以檢測偏差或不平衡模式，使用 Azure Machine Learning 的自定義模型為高級數據科學組織提供支持。
人工監督與合規： 對於敏感任務，人工審查仍然必不可少。Agentic RAG 並不取代人類在高風險決策中的判斷，而是通過提供經過充分審核的選項來輔助人類。

擁有能夠提供清晰行動記錄的工具至關重要。沒有這些工具，調試多步驟過程可能會非常困難。以下是 Literal AI（Chainlit 背後的公司）提供的一個代理運行示例：

AgentRunExample

結論

Agentic RAG 代表了人工智能系統在處理複雜且數據密集型任務方面的自然演進。通過採用循環交互模式、自主選擇工具以及改進查詢直到達成高質量結果，系統超越了靜態的提示跟隨，成為更具適應性和上下文感知的決策者。儘管仍然受限於人類定義的基礎設施和道德準則，這些 agentic 能力使企業和終端用戶能夠享受更豐富、更動態且更有價值的人工智能交互。

對 Agentic RAG 有更多疑問？

加入 Azure AI Foundry Discord，與其他學習者交流，參加辦公時間並解答您的 AI Agents 問題。

其他資源

學術論文

上一課

工具使用設計模式

下一課

構建值得信賴的 AI 代理

免責聲明：
本文件已使用人工智能翻譯服務 Co-op Translator 進行翻譯。儘管我們致力於提供準確的翻譯，但請注意，自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於重要信息，建議使用專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或錯誤解釋概不負責。

This site is open source. Improve this page.