ai-agents-for-beginners

Agentic RAG

(Kattints a fenti képre a lecke videójának megtekintéséhez)

Agentic RAG

Ez a lecke átfogó áttekintést nyújt az Agentic Retrieval-Augmented Generation (Agentic RAG) nevű új AI-paradigmáról, amelyben a nagy nyelvi modellek (LLM-ek) önállóan tervezik meg következő lépéseiket, miközben külső forrásokból gyűjtenek információt. A statikus “keresés-és-olvasás” mintákkal ellentétben az Agentic RAG iteratív hívásokat végez az LLM-re, amelyeket eszköz- vagy funkcióhívások és strukturált kimenetek szakítanak meg. A rendszer értékeli az eredményeket, finomítja a lekérdezéseket, szükség esetén további eszközöket hív meg, és folytatja ezt a ciklust, amíg kielégítő megoldást nem ér el.

Bevezetés

Ez a lecke az alábbiakat tartalmazza:

Tanulási célok

A lecke elvégzése után képes leszel:

Mi az az Agentic RAG?

Az Agentic Retrieval-Augmented Generation (Agentic RAG) egy új AI-paradigma, amelyben a nagy nyelvi modellek (LLM-ek) önállóan tervezik meg következő lépéseiket, miközben külső forrásokból gyűjtenek információt. A statikus “keresés-és-olvasás” mintákkal ellentétben az Agentic RAG iteratív hívásokat végez az LLM-re, amelyeket eszköz- vagy funkcióhívások és strukturált kimenetek szakítanak meg. A rendszer értékeli az eredményeket, finomítja a lekérdezéseket, szükség esetén további eszközöket hív meg, és folytatja ezt a ciklust, amíg kielégítő megoldást nem ér el. Ez az iteratív „maker-checker” stílus javítja a helyességet, kezeli a hibás lekérdezéseket, és biztosítja a magas színvonalú eredményeket.

A rendszer aktívan irányítja a gondolkodási folyamatát, újraírja a sikertelen lekérdezéseket, különböző lekérdezési módszereket választ, és több eszközt integrál—például vektorkeresést az Azure AI Search-ben, SQL adatbázisokat vagy egyedi API-kat—mielőtt véglegesítené a válaszát. Az agentikus rendszer megkülönböztető jellemzője, hogy képes önállóan irányítani a gondolkodási folyamatát. A hagyományos RAG-megvalósítások előre meghatározott utakon alapulnak, de egy agentikus rendszer autonóm módon határozza meg a lépések sorrendjét az általa talált információk minősége alapján.

Az Agentic Retrieval-Augmented Generation (Agentic RAG) meghatározása

Az Agentic Retrieval-Augmented Generation (Agentic RAG) egy új AI-fejlesztési paradigma, amelyben az LLM-ek nemcsak külső adatforrásokból gyűjtenek információt, hanem önállóan tervezik meg következő lépéseiket. A statikus “keresés-és-olvasás” mintákkal vagy gondosan szkriptelt prompt-szekvenciákkal ellentétben az Agentic RAG egy iteratív hívási ciklust alkalmaz az LLM-re, amelyet eszköz- vagy funkcióhívások és strukturált kimenetek szakítanak meg. Minden lépésnél a rendszer értékeli az elért eredményeket, eldönti, hogy finomítja-e a lekérdezéseket, szükség esetén további eszközöket hív meg, és folytatja ezt a ciklust, amíg kielégítő megoldást nem ér el.

Ez az iteratív „maker-checker” működési stílus a helyesség javítására, a strukturált adatbázisokhoz (pl. NL2SQL) kapcsolódó hibás lekérdezések kezelésére és kiegyensúlyozott, magas színvonalú eredmények biztosítására szolgál. A gondosan megtervezett prompt-láncokra való támaszkodás helyett a rendszer aktívan irányítja a gondolkodási folyamatát. Újraírhatja a sikertelen lekérdezéseket, különböző lekérdezési módszereket választhat, és több eszközt integrálhat—például vektorkeresést az Azure AI Search-ben, SQL adatbázisokat vagy egyedi API-kat—mielőtt véglegesítené a válaszát. Ez megszünteti a túlzottan bonyolult orkesztrációs keretrendszerek szükségességét. Ehelyett egy viszonylag egyszerű „LLM-hívás → eszközhasználat → LLM-hívás → …” ciklus is kifinomult és jól megalapozott kimeneteket eredményezhet.

Agentic RAG Core Loop

A gondolkodási folyamat irányítása

Az a megkülönböztető tulajdonság, amely „agentikussá” tesz egy rendszert, az a képessége, hogy irányítsa a gondolkodási folyamatát. A hagyományos RAG-megvalósítások gyakran az emberek által előre meghatározott útra támaszkodnak: egy gondolatmenetre, amely meghatározza, mit és mikor kell lekérdezni.
De amikor egy rendszer valóban agentikus, belsőleg dönti el, hogyan közelítse meg a problémát. Nem csak egy szkriptet hajt végre; autonóm módon határozza meg a lépések sorrendjét az általa talált információk minősége alapján.
Például, ha egy termékbevezetési stratégiát kell létrehoznia, nem támaszkodik kizárólag egy olyan promptra, amely részletezi az egész kutatási és döntéshozatali munkafolyamatot. Ehelyett az agentikus modell önállóan dönt arról, hogy:

  1. Piaci trendjelentéseket szerezzen be a Bing Web Grounding segítségével.
  2. Releváns versenytársi adatokat azonosítson az Azure AI Search használatával.
  3. Történelmi belső értékesítési mutatókat kapcsoljon össze az Azure SQL Database segítségével.
  4. Az eredményeket egy koherens stratégiává szintetizálja az Azure OpenAI Service segítségével.
  5. Értékelje a stratégiát hiányosságok vagy ellentmondások szempontjából, és szükség esetén újabb lekérdezési kört indítson.

Mindezeket a lépéseket—a lekérdezések finomítása, források kiválasztása, iteráció addig, amíg „elégedett” a válasszal—a modell dönti el, nem egy ember által előre szkriptelt folyamat.

Iteratív ciklusok, eszközintegráció és memória

Tool Integration Architecture

Egy agentikus rendszer egy iteratív interakciós mintára támaszkodik:

Idővel ez egy fejlődő megértés érzetét kelti, lehetővé téve a modell számára, hogy összetett, több lépésből álló feladatokat hajtson végre anélkül, hogy az embernek folyamatosan be kellene avatkoznia vagy újra kellene formálnia a promptot.

Hibakezelési módok és önkorrekció

Az Agentic RAG autonómiája robusztus önkorrekciós mechanizmusokat is magában foglal. Amikor a rendszer zsákutcába jut—például irreleváns dokumentumokat szerez be, vagy hibás lekérdezésekkel találkozik—, képes:

Ez az iteratív és dinamikus megközelítés lehetővé teszi a modell számára, hogy folyamatosan fejlődjön, biztosítva, hogy ne csak egy egyszeri rendszer legyen, hanem olyan, amely tanul a hibáiból egy adott munkamenet során.

Self Correction Mechanism

Az ügynökség határai

Annak ellenére, hogy egy feladaton belül autonóm, az Agentic RAG nem azonos a mesterséges általános intelligenciával. Az „agentikus” képességei az emberi fejlesztők által biztosított eszközökre, adatforrásokra és irányelvekre korlátozódnak. Nem képes saját eszközöket kitalálni vagy túllépni az előre meghatározott domain-határokon. Ehelyett a rendelkezésre álló erőforrások dinamikus összehangolásában jeleskedik.
A fejlettebb AI-formáktól való kulcsfontosságú különbségek a következők:

  1. Domain-specifikus autonómia: Az Agentic RAG rendszerek a felhasználó által meghatározott célok elérésére összpontosítanak egy ismert domainen belül, olyan stratégiákat alkalmazva, mint a lekérdezések újraírása vagy eszközválasztás az eredmények javítása érdekében.
  2. Infrastruktúra-függőség: A rendszer képességei a fejlesztők által integrált eszközöktől és adatoktól függenek. Emberi beavatkozás nélkül nem lépheti túl ezeket a határokat.
  3. Korlátok tiszteletben tartása: Az etikai irányelvek, megfelelőségi szabályok és üzleti politikák továbbra is nagyon fontosak. Az ügynök szabadsága mindig biztonsági intézkedések és felügyeleti mechanizmusok által korlátozott (remélhetőleg?).

Gyakorlati felhasználási esetek és érték

Az Agentic RAG kiemelkedően teljesít olyan helyzetekben, amelyek iteratív finomítást és precizitást igényelnek:

  1. Helyesség-központú környezetek: Megfelelőségi ellenőrzések, szabályozási elemzések vagy jogi kutatások során az agentikus modell ismételten ellenőrizheti a tényeket, több forrást konzultálhat, és újraírhatja Implementálja a Retrieval Augmented Generation (RAG) technológiát az Azure OpenAI Service segítségével: Ismerje meg, hogyan használhatja saját adatait az Azure OpenAI Service-ben. Ez a Microsoft Learn modul átfogó útmutatót nyújt a RAG megvalósításához.

Tudományos cikkek

Előző lecke

Eszközhasználati tervezési minta

Következő lecke

Megbízható AI ügynökök építése


Felelősség kizárása:
Ez a dokumentum az AI fordítási szolgáltatás Co-op Translator segítségével lett lefordítva. Bár törekszünk a pontosságra, kérjük, vegye figyelembe, hogy az automatikus fordítások hibákat vagy pontatlanságokat tartalmazhatnak. Az eredeti dokumentum az eredeti nyelvén tekintendő hiteles forrásnak. Kritikus információk esetén javasolt professzionális emberi fordítást igénybe venni. Nem vállalunk felelősséget semmilyen félreértésért vagy téves értelmezésért, amely a fordítás használatából eredhet.