ai-agents-for-beginners

Agentic RAG

(點擊上方圖片觀看本課程影片)

Agentic RAG

本課程全面介紹了 Agentic 以檢索為增強的生成(Agentic RAG),這是一種新興的 AI 範式,大型語言模型(LLM)在從外部資源提取資訊的同時,能自主規劃下一步。與靜態的先檢索後閱讀模式不同,Agentic RAG 涉及迭代調用 LLM,穿插工具或函數調用與結構化輸出。系統會評估結果,完善查詢,必要時調用更多工具,並持續該循環直至獲得令人滿意的解決方案。

介紹

本課程將涵蓋

學習目標

完成本課程後,您將能了解/掌握:

什麼是 Agentic RAG?

Agentic Retrieval-Augmented Generation(Agentic RAG)是一種新興 AI 範式,大型語言模型(LLM)可在從外部資料源提取資訊時,自主規劃下一步。與靜態的先檢索再閱讀模式不同,Agentic RAG 涉及對 LLM 的迭代調用,中間穿插工具或函數調用並產生結構化輸出。系統會評估結果,精煉查詢,必要時呼叫更多工具,反覆執行該循環直到達到滿意的解決方案。這種迭代的「製作者-核查者」風格提升了正確性,能處理錯誤格式查詢並確保成果品質優良。

系統積極掌控它的推理流程,重寫失敗的查詢,選擇不同的檢索方法,整合多種工具——如 Azure AI Search 中的向量搜尋、SQL 資料庫或自訂 API——然後才給出最終答案。agentic 系統的顯著特質是能自主擁有推理過程。傳統 RAG 實現依賴預先定義的路徑,但 agentic 系統會基於找到資訊的品質,自主決定步驟次序。

定義 Agentic Retrieval-Augmented Generation(Agentic RAG)

Agentic Retrieval-Augmented Generation(Agentic RAG)是 AI 發展中的新興範式,LLM 不僅從外部資料源撈取資訊,還能自主安排下一步。不同於靜態的先檢索再閱讀模式或精心設計的提示序列,Agentic RAG 包含一個迭代調用 LLM 的循環,穿插工具或函數調用和結構化輸出。每一步系統都會評估獲得的結果,決定是否完善查詢,有需要時調用其他工具,並持續這個循環直到達成滿意方案。

這種迭代的「製作者-核查者」操作風格,旨在提升正確率,處理結構化資料庫(如 NL2SQL)裡格式錯誤的查詢,並確保平衡且高品質的結果。系統不再僅靠精心設計的提示鏈,而是積極擁有推理過程。它可以重寫失敗的查詢,選擇不同的檢索方法,整合多種工具——例如 Azure AI Search 的向量搜尋、SQL 資料庫或自訂 API——最後產出答案。這樣就不必依賴過於複雜的調度框架,而是以相對簡單的「LLM 調用 → 工具使用 → LLM 調用 → …」循環,產生複雜且基礎堅實的輸出。

Agentic RAG Core Loop

掌握推理過程

使系統具備「agentic」特質的關鍵,是它擁有自身推理過程的能力。傳統 RAG 往往依賴人類預先定義模型路徑:思維鏈(chain-of-thought)說明何時檢索什麼。

然而真正 agentic 的系統會自主決定如何處理問題。它不是執行腳本,而是根據找到資訊的品質自主規劃步驟順序。

例如,被要求制定產品上市策略時,它不僅依靠將整個研究和決策流程寫入提示,而是 agentic 模型會獨立決定:

  1. 利用 Bing 網路基礎檢索當前的市場趨勢報告。
  2. 使用 Azure AI Search 確定相關競爭者資料。
  3. 透過 Azure SQL Database 將歷史內部銷售指標進行關聯分析。
  4. 藉由 Azure OpenAI 服務協調,綜合這些發現形成一套策略。
  5. 評估策略是否存在缺口或不一致,必要時觸發另一輪檢索。

所有這些步驟——完善查詢、選擇資料來源、反覆迭代直到滿意回覆——都由模型決定,而非人類預先腳本化。

迭代循環、工具整合與記憶

Tool Integration Architecture

agentic 系統依賴迴圈互動模式:

隨著時間推移,這產生持續演進的理解力,使模型能順利處理複雜多步任務,無需人為頻繁介入或重新調整提示。

處理失敗模式與自我修正

Agentic RAG 的自主性還包括強健的自我修正機制。當系統遇到死胡同——例如檢索到無關文件或遭遇格式錯誤查詢時——它能:

此迭代且動態的方式讓模型能持續改進,保證它非一次性機制,而是在會話中從誤差中學習。

Self Correction Mechanism

行動邊界

儘管在任務內具自主性,Agentic RAG 並不等同於通用人工智慧。它的「agentic」能力限於人類開發者提供的工具、資料來源與政策。它無法自行創造工具或超越既定領域邊界。它擅長的是動態調度現有資源。

與更高階 AI 型態的主要差異包括:

  1. 特定領域自治: Agentic RAG 系統專注於在已知領域內達成使用者定義目標,通過查詢重寫或工具選擇來優化結果。
  2. 基礎架構依賴: 系統能力依賴開發者整合的工具與資料。無人為介入無法突破這些限制。
  3. 遵循守則: 倫理指導、合規規則和商業政策仍然非常重要。Agent 的自由度永遠被安全措施與監管機制所限制(希望如此?)。

實務用例與價值

Agentic RAG 在需迭代精進且精確的場景中表現出色:

  1. 以正確性為先的環境: 在合規審查、法規分析或法律研究中,agentic 模型可反覆驗證事實、查閱多個來源、重寫查詢直到產出徹底審核過的答案。
  2. 複雜資料庫操作: 處理結構化資料時,查詢經常失敗或需調整,系統可自主優化查詢,利用 Azure SQL 或 Microsoft Fabric OneLake,確保最終檢索符合使用者意圖。
  3. 長時間工作流程: 長度較長的會話可能隨著新資訊浮現而演變。Agentic RAG 能持續吸收新資料,隨著對問題空間了解加深調整策略。

治理、透明度與信任

隨著系統推理越來越自主,治理與透明度成為關鍵:

具備可明確記錄行動的工具至關重要。缺乏此類工具,調試多階段過程將非常困難。以下為 Literal AI(Chainlit 背後公司)提供的一個 Agent 執行範例:

AgentRunExample

結論

Agentic RAG 代表 AI 系統處理複雜且資料密集任務的自然演進。採用迭代互動模式,自主選擇工具,並精煉查詢直到獲得高品質結果,使系統超越靜態提示跟隨者,進入更具適應性且具情境感知的決策者階段。雖仍受限於人類定義的基礎設施與倫理準則,但這些 agentic 能力為企業與終端用戶帶來更豐富、更動態且更實用的 AI 互動體驗。

想了解更多 Agentic RAG?

加入 Microsoft Foundry Discord,與其他學習者交流,參加辦公時間並解決您的 AI Agents 問題。

附加資源

學術論文

上一課

工具使用設計模式

下一課

建立值得信賴的 AI 代理


免責聲明
本文件係使用 AI 翻譯服務 Co-op Translator 進行翻譯。雖然我們致力於確保翻譯的準確性,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應視為權威來源。對於重要資訊,建議聘請專業人工翻譯。我們不對因使用此翻譯而產生的任何誤解或誤譯負責。