ai-agents-for-beginners

Agentikus RAG

(Kattintson a fenti képre a lecke videójának megtekintéséhez)

Agentikus RAG

Ez a lecke átfogó áttekintést nyújt az Agentikus Retrieval-Augmented Generationről (Agentikus RAG), egy feltörekvő MI-paradigmáról, ahol a nagy nyelvi modellek (LLM-ek) önállóan megtervezik a következő lépéseiket, miközben külső forrásokból hívnak le információkat. A statikus „lekérés-és-olvasás” mintáktól eltérően az Agentikus RAG iteratív LLM-hívásokat tartalmaz, eszköz- vagy függvényhívásokkal és strukturált kimenetekkel megszakítva. A rendszer kiértékeli az eredményeket, finomítja a lekérdezéseket, szükség esetén további eszközöket hív meg, és folytatja ezt a ciklust, amíg kielégítő megoldást nem ér el.

Bevezetés

Ez a lecke a következőket fedi le

Tanulási célok

A lecke elvégzése után tudni fogja/meg fogja érteni:

Mi az Agentikus RAG?

Az Agentikus Retrieval-Augmented Generation (Agentikus RAG) egy olyan feltörekvő AI-paradigma, ahol a nagy nyelvi modellek (LLM-ek) nemcsak információt húznak külső adatforrásokból, hanem önállóan megtervezik a következő lépéseiket. A statikus „lekérés-then-olvasás” mintákkal vagy gondosan megírt prompt-szekvenciákkal ellentétben az Agentikus RAG egy iteratív LLM-hívás hurkot foglal magában, amelyet eszköz- vagy függvényhívások és strukturált kimenetek szakítanak meg. Minden lépésnél a rendszer kiértékeli az eredményeket, eldönti, hogy szükséges-e a lekérdezések finomítása, meghív további eszközöket, ha kell, és folytatja a ciklust, amíg kielégítő megoldást nem ér el. Ez az iteratív „készítő-ellenőrző” stílus javítja a helyességet, kezeli a strukturált adatbázisokhoz tartozó hibás lekérdezéseket (például NL2SQL), és biztosítja a kiegyensúlyozott, magas minőségű eredményeket.

A rendszer aktívan birtokolja az érvelési folyamatát: újraírásra kerülnek a sikertelen lekérdezések, más lekérési módszerek kerülhetnek kiválasztásra, és több eszköz integrálható — például vektorkeresés az Azure AI Search-ben, SQL adatbázisok vagy egyedi API-k — mielőtt véglegesítené a válaszát. Az agentikus rendszer megkülönböztető tulajdonsága az, hogy képes saját maga felvállalni az érvelési folyamatot. A hagyományos RAG-megoldások előre meghatározott utakra támaszkodnak, de egy agentikus rendszer önállóan határozza meg a lépések sorrendjét az általa talált információk minősége alapján.

Az Agentikus Retrieval-Augmented Generation (Agentikus RAG) definiálása

Az Agentikus Retrieval-Augmented Generation (Agentikus RAG) egy olyan felemelkedő paradigma az AI fejlesztésben, ahol az LLM-ek nemcsak külső adatforrásokból húznak információt, hanem önállóan meg is tervezik a következő lépéseiket. A statikus lekérés-then-olvasás mintákkal vagy gondosan megírt promptláncokkal ellentétben az Agentikus RAG egy iteratív LLM-hívásokból álló hurkot foglal magában, amelyet eszköz- vagy függvényhívások és strukturált kimenetek szakítanak meg. Minden lépésnél a rendszer kiértékeli a kapott eredményeket, eldönti, hogy érdemes-e finomítani a lekérdezéseket, szükség esetén további eszközöket hív meg, és folytatja a ciklust, amíg kielégítő megoldást nem ér el.

Ez az iteratív „készítő-ellenőrző” működési stílus a helyesség javítására szolgál, kezeli a strukturált adatbázisokhoz tartozó hibás lekérdezéseket (például NL2SQL), és biztosít kiegyensúlyozott, magas minőségű eredményeket. Ahelyett, hogy kizárólag gondosan megtervezett prompt láncokra támaszkodna, a rendszer aktívan birtokolja az érvelési folyamatát. Újraírhatja a sikertelen lekérdezéseket, más lekérési módszereket választhat, és több eszközt integrálhat — például vektorkeresést az Azure AI Search-ben, SQL adatbázisokat vagy egyedi API-kat — mielőtt véglegesíti a válaszát. Ez csökkenti a túlbonyolított orchestration-keretrendszerek szükségességét. Helyette egy viszonylag egyszerű „LLM-hívás → eszköz használata → LLM-hívás → …” ciklus is kifinomult és jól megalapozott kimeneteket eredményezhet.

Agentikus RAG fő hurok

A gondolkodási folyamat birtoklása

Az a megkülönböztető tulajdonság, amely egy rendszert „agentikus”-szá tesz, az, hogy képes saját maga birtokolni az érvelési folyamatát. A hagyományos RAG-implementációk gyakran emberi előre definiált útvonalra támaszkodnak: egy gondolatmenetre, amely meghatározza, mit kell lekérni és mikor. De ha egy rendszer valóban agentikus, akkor belsőleg dönt arról, hogyan közelítse meg a problémát. Nem pusztán egy szkriptet hajt végre; önállóan határozza meg a lépések sorrendjét az általa talált információ minősége alapján. Például, ha arra kérik, hogy hozzon létre egy termékbevezetési stratégiát, nem csupán egy olyan prompttól függ, amely részletezi az egész kutatási és döntéshozatali munkafolyamatot. Ehelyett az agentikus modell önállóan úgy dönt, hogy:

  1. Retrieve current market trend reports using Bing Web Grounding
  2. Identify relevant competitor data using Azure AI Search.
  3. Correlate historical internal sales metrics using Azure SQL Database.
  4. Synthesize the findings into a cohesive strategy orchestrated via Azure OpenAI Service.
  5. Evaluate the strategy for gaps or inconsistencies, prompting another round of retrieval if necessary. Mindezeket a lépéseket — a lekérdezések finomítását, a források kiválasztását és az iterálást, amíg „elégedett” a válasszal — a modell döntései vezérlik, nem pedig egy ember által előre megírt szkript.

Ismétlődő hurkok, eszközintegráció és memória

Eszközintegrációs architektúra

Egy agentikus rendszer egy hurkolt interakciós mintára támaszkodik:

Idővel ez egy fejlődő megértés érzetét teremti, lehetővé téve, hogy a modell összetett, több lépésből álló feladatokat navigáljon anélkül, hogy egy embernek folyamatosan be kellene avatkoznia vagy újraformálnia a promptot.

Hibamódok kezelése és önkorrekció

Az Agentikus RAG autonómiája kiterjed a robusztus önkorrekciós mechanizmusokra is. Amikor a rendszer zsákutcákba ütközik — például irreleváns dokumentumok lekérése vagy hibás lekérdezésekkel való találkozás —, képes:

Ez az iteratív és dinamikus megközelítés lehetővé teszi, hogy a modell folyamatosan javuljon, biztosítva, hogy ne csak egy egyszeri rendszer legyen, hanem olyan, amely a munkamenet során tanul a hibáiból.

Önkorrekciós mechanizmus

Az ügynökség határai

Autonómiája ellenére egy Agentikus RAG nem analóg az Általános Mesterséges Intelligenciával. „Agentikus” képességei korlátozódnak az emberi fejlesztők által biztosított eszközökre, adatforrásokra és szabályokra. Nem tudja feltalálni saját eszközeit vagy kilépni a megadott doménhatárokon. Ehelyett kiválóan képes dinamikusan megszervezni a rendelkezésre álló erőforrásokat. A fejlettebb MI-formáktól való kulcsfontosságú különbségek például:

  1. Doménspecifikus autonómia: Az Agentikus RAG rendszerek a felhasználó által meghatározott célok elérésére összpontosítanak egy ismert doménon belül, olyan stratégiákat alkalmazva, mint a lekérdezés-újraírás vagy az eszközválasztás a jobb eredmények érdekében.
  2. Infrastruktúrától való függés: A rendszer képességei az integrált eszközöktől és adatoktól függenek, amelyeket a fejlesztők adnak hozzá. Emberi beavatkozás nélkül nem képes túllépni ezeken a határokon.
  3. A védőkorlátok tisztelete: Etikai irányelvek, megfelelőségi szabályok és üzleti politikák továbbra is rendkívül fontosak. Az ügynök szabadságát mindig biztonsági intézkedések és felügyeleti mechanizmusok korlátozzák (remélhetőleg).

Gyakorlati felhasználási esetek és érték

Az Agentikus RAG olyan helyzetekben tűnik ki, ahol iteratív finomításra és pontosságra van szükség:

  1. Helyesség-központú környezetek: Megfelelőségi ellenőrzések, szabályozási elemzések vagy jogi kutatás esetén az agentikus modell többször ellenőrizheti a tényeket, több forrást konzultálhat és újraíratja a lekérdezéseket, amíg alaposan le nem ellenőrizett választ nem ad.
  2. Összetett adatbázis-interakciók: Strukturált adatok kezelésekor, ahol a lekérdezések gyakran hibázhatnak vagy finomításra szorulhatnak, a rendszer önállóan finomíthatja a lekérdezéseit Azure SQL vagy Microsoft Fabric OneLake használatával, biztosítva, hogy a végső lekérés megfeleljen a felhasználó szándékának.
  3. Kiterjesztett munkafolyamatok: Hosszabb munkamenetek esetén a folyamat fejlődhet, ahogy új információk bukkannak fel. Az Agentikus RAG folyamatosan beépítheti az új adatokat, és stratégiát vált, ahogy többet megtud a probléma területéről.

Kormányzás, átláthatóság és bizalom

Ahogy ezek a rendszerek egyre autonómabbá válnak az érvelésükben, a kormányzás és az átláthatóság létfontosságú:

Fontos, hogy rendelkezésre álljanak olyan eszközök, amelyek világos cselekvési nyilvántartást biztosítanak. Nélkülük egy többlépéses folyamat hibakeresése nagyon nehéz lehet. Lásd a Literal AI (a Chainlit mögött álló cég) alábbi példáját egy Agent futtatásról:

Agent futtatási példa

Következtetés

Az Agentikus RAG a természetes fejlődést képviseli abban, hogy az MI rendszerek hogyan kezelik az összetett, adatigényes feladatokat. A hurkolt interakciós minta alkalmazásával, az eszközök önálló kiválasztásával és a lekérdezések finomításával a rendszer az egyszerű promptkövetéstől egy adaptívabb, kontextusérzékeny döntéshozó felé lép. Bár továbbra is az ember által meghatározott infrastruktúrák és etikai irányelvek korlátozzák, ezek az agentikus képességek gazdagabb, dinamikusabb és végső soron hasznosabb MI-interakciókat tesznek lehetővé mind az vállalatok, mind a végfelhasználók számára.

Több kérdésed van az Agentikus RAG-ról?

Csatlakozz a Microsoft Foundry Discord-hoz, hogy találkozz más tanulókkal, részt vegyél az office hours eseményeken és megválaszoltathasd az AI Agents-szel kapcsolatos kérdéseidet.

További források

Tudományos publikációk

Előző lecke

Eszközhasználat tervezési mintázata

Következő lecke

Megbízható MI-ügynökök építése


Felelősségkizárás: Ezt a dokumentumot a mesterséges intelligencián alapuló fordítószolgáltatás, a Co-op Translator segítségével fordítottuk. Bár a pontosságra törekszünk, kérjük, vegye figyelembe, hogy az automatikus fordítások hibákat vagy pontatlanságokat tartalmazhatnak. Az eredeti, anyanyelvi dokumentum tekintendő a hiteles forrásnak. Fontos információk esetén emberi, szakmai fordítást javaslunk. Nem vállalunk felelősséget az e fordítás használatából eredő félreértésekért vagy téves értelmezésekért.