(Kattints a fenti képre a lecke videójának megtekintéséhez)
Ez a lecke átfogó áttekintést nyújt az Agentic Retrieval-Augmented Generation (Agentic RAG) nevű új AI-paradigmáról, amelyben a nagy nyelvi modellek (LLM-ek) önállóan tervezik meg következő lépéseiket, miközben külső forrásokból gyűjtenek információt. A statikus “keresés-és-olvasás” mintákkal ellentétben az Agentic RAG iteratív hívásokat végez az LLM-re, amelyeket eszköz- vagy funkcióhívások és strukturált kimenetek szakítanak meg. A rendszer értékeli az eredményeket, finomítja a lekérdezéseket, szükség esetén további eszközöket hív meg, és folytatja ezt a ciklust, amíg kielégítő megoldást nem ér el.
Ez a lecke az alábbiakat tartalmazza:
A lecke elvégzése után képes leszel:
Az Agentic Retrieval-Augmented Generation (Agentic RAG) egy új AI-paradigma, amelyben a nagy nyelvi modellek (LLM-ek) önállóan tervezik meg következő lépéseiket, miközben külső forrásokból gyűjtenek információt. A statikus “keresés-és-olvasás” mintákkal ellentétben az Agentic RAG iteratív hívásokat végez az LLM-re, amelyeket eszköz- vagy funkcióhívások és strukturált kimenetek szakítanak meg. A rendszer értékeli az eredményeket, finomítja a lekérdezéseket, szükség esetén további eszközöket hív meg, és folytatja ezt a ciklust, amíg kielégítő megoldást nem ér el. Ez az iteratív „maker-checker” stílus javítja a helyességet, kezeli a hibás lekérdezéseket, és biztosítja a magas színvonalú eredményeket.
A rendszer aktívan irányítja a gondolkodási folyamatát, újraírja a sikertelen lekérdezéseket, különböző lekérdezési módszereket választ, és több eszközt integrál—például vektorkeresést az Azure AI Search-ben, SQL adatbázisokat vagy egyedi API-kat—mielőtt véglegesítené a válaszát. Az agentikus rendszer megkülönböztető jellemzője, hogy képes önállóan irányítani a gondolkodási folyamatát. A hagyományos RAG-megvalósítások előre meghatározott utakon alapulnak, de egy agentikus rendszer autonóm módon határozza meg a lépések sorrendjét az általa talált információk minősége alapján.
Az Agentic Retrieval-Augmented Generation (Agentic RAG) egy új AI-fejlesztési paradigma, amelyben az LLM-ek nemcsak külső adatforrásokból gyűjtenek információt, hanem önállóan tervezik meg következő lépéseiket. A statikus “keresés-és-olvasás” mintákkal vagy gondosan szkriptelt prompt-szekvenciákkal ellentétben az Agentic RAG egy iteratív hívási ciklust alkalmaz az LLM-re, amelyet eszköz- vagy funkcióhívások és strukturált kimenetek szakítanak meg. Minden lépésnél a rendszer értékeli az elért eredményeket, eldönti, hogy finomítja-e a lekérdezéseket, szükség esetén további eszközöket hív meg, és folytatja ezt a ciklust, amíg kielégítő megoldást nem ér el.
Ez az iteratív „maker-checker” működési stílus a helyesség javítására, a strukturált adatbázisokhoz (pl. NL2SQL) kapcsolódó hibás lekérdezések kezelésére és kiegyensúlyozott, magas színvonalú eredmények biztosítására szolgál. A gondosan megtervezett prompt-láncokra való támaszkodás helyett a rendszer aktívan irányítja a gondolkodási folyamatát. Újraírhatja a sikertelen lekérdezéseket, különböző lekérdezési módszereket választhat, és több eszközt integrálhat—például vektorkeresést az Azure AI Search-ben, SQL adatbázisokat vagy egyedi API-kat—mielőtt véglegesítené a válaszát. Ez megszünteti a túlzottan bonyolult orkesztrációs keretrendszerek szükségességét. Ehelyett egy viszonylag egyszerű „LLM-hívás → eszközhasználat → LLM-hívás → …” ciklus is kifinomult és jól megalapozott kimeneteket eredményezhet.
Az a megkülönböztető tulajdonság, amely „agentikussá” tesz egy rendszert, az a képessége, hogy irányítsa a gondolkodási folyamatát. A hagyományos RAG-megvalósítások gyakran az emberek által előre meghatározott útra támaszkodnak: egy gondolatmenetre, amely meghatározza, mit és mikor kell lekérdezni.
De amikor egy rendszer valóban agentikus, belsőleg dönti el, hogyan közelítse meg a problémát. Nem csak egy szkriptet hajt végre; autonóm módon határozza meg a lépések sorrendjét az általa talált információk minősége alapján.
Például, ha egy termékbevezetési stratégiát kell létrehoznia, nem támaszkodik kizárólag egy olyan promptra, amely részletezi az egész kutatási és döntéshozatali munkafolyamatot. Ehelyett az agentikus modell önállóan dönt arról, hogy:
Mindezeket a lépéseket—a lekérdezések finomítása, források kiválasztása, iteráció addig, amíg „elégedett” a válasszal—a modell dönti el, nem egy ember által előre szkriptelt folyamat.
Egy agentikus rendszer egy iteratív interakciós mintára támaszkodik:
Idővel ez egy fejlődő megértés érzetét kelti, lehetővé téve a modell számára, hogy összetett, több lépésből álló feladatokat hajtson végre anélkül, hogy az embernek folyamatosan be kellene avatkoznia vagy újra kellene formálnia a promptot.
Az Agentic RAG autonómiája robusztus önkorrekciós mechanizmusokat is magában foglal. Amikor a rendszer zsákutcába jut—például irreleváns dokumentumokat szerez be, vagy hibás lekérdezésekkel találkozik—, képes:
Ez az iteratív és dinamikus megközelítés lehetővé teszi a modell számára, hogy folyamatosan fejlődjön, biztosítva, hogy ne csak egy egyszeri rendszer legyen, hanem olyan, amely tanul a hibáiból egy adott munkamenet során.
Annak ellenére, hogy egy feladaton belül autonóm, az Agentic RAG nem azonos a mesterséges általános intelligenciával. Az „agentikus” képességei az emberi fejlesztők által biztosított eszközökre, adatforrásokra és irányelvekre korlátozódnak. Nem képes saját eszközöket kitalálni vagy túllépni az előre meghatározott domain-határokon. Ehelyett a rendelkezésre álló erőforrások dinamikus összehangolásában jeleskedik.
A fejlettebb AI-formáktól való kulcsfontosságú különbségek a következők:
Az Agentic RAG kiemelkedően teljesít olyan helyzetekben, amelyek iteratív finomítást és precizitást igényelnek:
Eszközhasználati tervezési minta
Megbízható AI ügynökök építése
Felelősség kizárása:
Ez a dokumentum az AI fordítási szolgáltatás Co-op Translator segítségével lett lefordítva. Bár törekszünk a pontosságra, kérjük, vegye figyelembe, hogy az automatikus fordítások hibákat vagy pontatlanságokat tartalmazhatnak. Az eredeti dokumentum az eredeti nyelvén tekintendő hiteles forrásnak. Kritikus információk esetén javasolt professzionális emberi fordítást igénybe venni. Nem vállalunk felelősséget semmilyen félreértésért vagy téves értelmezésért, amely a fordítás használatából eredhet.