ai-agents-for-beginners

Agentic RAG

(Kattints a fenti képre a leckéhez tartozó videó megtekintéséhez)

Agentic RAG

Ez a lecke átfogó áttekintést nyújt az Agentic Retrieval-Augmented Generation (Agentic RAG) nevű új AI paradigmáról, amelyben a nagy nyelvi modellek (LLM-ek) önállóan tervezik meg következő lépéseiket, miközben külső forrásokból gyűjtenek információt. A statikus “keresés-olvasás” mintázatokkal ellentétben az Agentic RAG iteratív hívásokat végez az LLM-hez, amelyeket eszköz- vagy funkcióhívások és strukturált kimenetek szakítanak meg. A rendszer értékeli az eredményeket, finomítja a lekérdezéseket, szükség esetén további eszközöket hív meg, és folytatja ezt a ciklust, amíg kielégítő megoldást nem ér el.

Bevezetés

Ebben a leckében az alábbiakat fogjuk tárgyalni:

Tanulási célok

A lecke elvégzése után képes leszel:

Mi az Agentic RAG?

Az Agentic Retrieval-Augmented Generation (Agentic RAG) egy új AI paradigma, amelyben a nagy nyelvi modellek (LLM-ek) önállóan tervezik meg következő lépéseiket, miközben külső forrásokból gyűjtenek információt. A statikus “keresés-olvasás” mintázatokkal ellentétben az Agentic RAG iteratív hívásokat végez az LLM-hez, amelyeket eszköz- vagy funkcióhívások és strukturált kimenetek szakítanak meg. A rendszer értékeli az eredményeket, finomítja a lekérdezéseket, szükség esetén további eszközöket hív meg, és folytatja ezt a ciklust, amíg kielégítő megoldást nem ér el. Ez az iteratív „maker-checker” stílus javítja a helyességet, kezeli a hibás lekérdezéseket, és biztosítja a magas minőségű eredményeket.

A rendszer aktívan irányítja a gondolkodási folyamatát, újraírja a sikertelen lekérdezéseket, különböző keresési módszereket választ, és több eszközt integrál—például vektorkeresést az Azure AI Search-ben, SQL adatbázisokat vagy egyedi API-kat—mielőtt véglegesítené válaszát. Az agentikus rendszer megkülönböztető tulajdonsága, hogy képes irányítani a gondolkodási folyamatát. A hagyományos RAG megvalósítások előre meghatározott útvonalakra támaszkodnak, de az agentikus rendszer önállóan határozza meg a lépések sorrendjét az általa talált információk minősége alapján.

Az Agentic Retrieval-Augmented Generation (Agentic RAG) meghatározása

Az Agentic Retrieval-Augmented Generation (Agentic RAG) egy új paradigma az AI fejlesztésében, amelyben az LLM-ek nemcsak külső adatforrásokból gyűjtenek információt, hanem önállóan tervezik meg következő lépéseiket. A statikus “keresés-olvasás” mintázatokkal vagy gondosan megírt prompt-szekvenciákkal ellentétben az Agentic RAG egy iteratív hívási ciklust alkalmaz az LLM-hez, amelyet eszköz- vagy funkcióhívások és strukturált kimenetek szakítanak meg. Minden lépésnél a rendszer értékeli az elért eredményeket, eldönti, hogy finomítja-e a lekérdezéseket, szükség esetén további eszközöket hív meg, és folytatja ezt a ciklust, amíg kielégítő megoldást nem ér el.

Ez az iteratív „maker-checker” működési stílus a helyesség javítására, a strukturált adatbázisokhoz (pl. NL2SQL) kapcsolódó hibás lekérdezések kezelésére és kiegyensúlyozott, magas minőségű eredmények biztosítására szolgál. A rendszer nem csupán gondosan megtervezett prompt-láncokra támaszkodik, hanem aktívan irányítja a gondolkodási folyamatát. Újraírhatja a sikertelen lekérdezéseket, különböző keresési módszereket választhat, és több eszközt integrálhat—például vektorkeresést az Azure AI Search-ben, SQL adatbázisokat vagy egyedi API-kat—mielőtt véglegesítené válaszát. Ez megszünteti az összetett orkestrációs keretrendszerek szükségességét. Ehelyett egy viszonylag egyszerű „LLM hívás → eszköz használat → LLM hívás → …” ciklus is képes kifinomult és jól megalapozott kimeneteket létrehozni.

Agentic RAG Core Loop

A gondolkodási folyamat irányítása

Az a megkülönböztető tulajdonság, amely „agentikussá” teszi a rendszert, az a képessége, hogy irányítsa a gondolkodási folyamatát. A hagyományos RAG megvalósítások gyakran arra támaszkodnak, hogy az emberek előre meghatározzák a modell útvonalát: egy gondolatmenetet, amely körvonalazza, mit kell lekérdezni és mikor.
De amikor egy rendszer valóban agentikus, belsőleg dönti el, hogyan közelítse meg a problémát. Nem csupán egy szkriptet hajt végre; önállóan határozza meg a lépések sorrendjét az általa talált információk minősége alapján.
Például, ha egy termékbevezetési stratégiát kell létrehoznia, nem csupán egy promptra támaszkodik, amely részletezi az egész kutatási és döntéshozatali munkafolyamatot. Ehelyett az agentikus modell önállóan dönt arról, hogy:

  1. Piaci trendjelentéseket gyűjt Bing Web Grounding segítségével.
  2. Releváns versenytársadatokat azonosít az Azure AI Search használatával.
  3. Történelmi belső értékesítési mutatókat korrelál az Azure SQL Database segítségével.
  4. Az eredményeket egy koherens stratégiává szintetizálja az Azure OpenAI Service segítségével.
  5. Értékeli a stratégiát hiányosságok vagy ellentmondások szempontjából, és szükség esetén újabb kör keresést indít.

Mindezeket a lépéseket—a lekérdezések finomítása, források kiválasztása, iteráció addig, amíg „elégedett” az eredménnyel—a modell dönti el, nem pedig egy ember által előre megírt szkript.

Iteratív ciklusok, eszközintegráció és memória

Tool Integration Architecture

Egy agentikus rendszer egy ciklikus interakciós mintázatra támaszkodik:

Idővel ez egy fejlődő megértés érzetét kelti, lehetővé téve a modell számára, hogy összetett, több lépésből álló feladatokat végezzen anélkül, hogy az embernek folyamatosan be kellene avatkoznia vagy módosítania kellene a promptot.

Hibakezelési módok és önkorrekció

Az Agentic RAG autonómiája robusztus önkorrekciós mechanizmusokat is magában foglal. Amikor a rendszer zsákutcába jut—például irreleváns dokumentumokat gyűjt vagy hibás lekérdezésekkel találkozik—képes:

Ez az iteratív és dinamikus megközelítés lehetővé teszi a modell számára, hogy folyamatosan javuljon, biztosítva, hogy ne csupán egy egyszeri rendszer legyen, hanem olyan, amely tanul a hibáiból egy adott munkamenet során.

Self Correction Mechanism

Az ügynökség határai

Annak ellenére, hogy autonóm egy feladaton belül, az Agentic RAG nem azonos az általános mesterséges intelligenciával. Az „agentikus” képességei az emberi fejlesztők által biztosított eszközökre, adatforrásokra és irányelvekre korlátozódnak. Nem tud saját eszközöket létrehozni vagy túllépni az előre meghatározott domain határain. Ehelyett a rendelkezésre álló erőforrások dinamikus orkestrációjában jeleskedik.
A fejlettebb AI formáktól való kulcsfontosságú különbségek a következők:

  1. Domain-specifikus autonómia: Az Agentic RAG rendszerek arra összpontosítanak, hogy felhasználó által meghatározott célokat érjenek el egy ismert domainen belül, olyan stratégiákat alkalmazva, mint a lekérdezés újraírása vagy eszközválasztás az eredmények javítása érdekében.
  2. Infrastruktúra-függőség: A rendszer képességei a fejlesztők által integrált eszközöktől és adatoktól függnek. Nem lépheti túl ezeket a határokat emberi beavatkozás nélkül.
  3. Védőkorlátok tiszteletben tartása: Az etikai irányelvek, megfelelőségi szabályok és üzleti politikák továbbra is nagyon fontosak. Az ügynök szabadsága mindig biztonsági intézkedések és felügyeleti mechanizmusok által korlátozott (remélhetőleg?).

Gyakorlati felhasználási esetek és érték

Az Agentic RAG kiemelkedően teljesít olyan helyzetekben, amelyek iteratív finomítást és pontosságot igényelnek:

  1. Helyesség-központú környezetek: Megfelelőségi ellenőrzésekben, szabályozási elemzésekben vagy jogi kutatásokban az agentikus modell többször ellenőrizheti a tényeket, több forrást konzultálhat, és újraírhatja a lekérdezéseket, amíg alaposan ellenőrzött választ nem ad.
  2. **Összet

Tudományos cikkek

Előző lecke

Eszközhasználati tervezési minta

Következő lecke

Megbízható AI ügynökök építése


Felelősség kizárása:
Ez a dokumentum az Co-op Translator AI fordítási szolgáltatás segítségével került lefordításra. Bár törekszünk a pontosságra, kérjük, vegye figyelembe, hogy az automatikus fordítások hibákat vagy pontatlanságokat tartalmazhatnak. Az eredeti dokumentum az eredeti nyelvén tekintendő hiteles forrásnak. Kritikus információk esetén javasolt professzionális emberi fordítást igénybe venni. Nem vállalunk felelősséget a fordítás használatából eredő félreértésekért vagy téves értelmezésekért.