ai-agents-for-beginners

Agentic RAG

(Kliknite na obrázok vyššie pre zobrazenie videa tejto lekcie)

Agentic RAG

Táto lekcia poskytuje komplexný prehľad o Agentic Retrieval-Augmented Generation (Agentic RAG), novom paradigme AI, kde veľké jazykové modely (LLMs) samostatne plánujú svoje ďalšie kroky, pričom získavajú informácie z externých zdrojov. Na rozdiel od statických vzorov „vyhľadaj a potom čítaj“ zahŕňa Agentic RAG iteratívne volania LLM, prerušované volaniami nástrojov alebo funkcií a štruktúrovanými výstupmi. Systém hodnotí výsledky, vylepšuje dopyty, v prípade potreby vyvoláva ďalšie nástroje a pokračuje v tomto cykle, kým sa nedosiahne uspokojivé riešenie.

Úvod

Táto lekcia pokryje

Ciele učenia

Po dokončení tejto lekcie budete vedieť/pochopíte:

Čo je Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) je vznikajúca paradigma AI, kde veľké jazykové modely (LLMs) samostatne plánujú svoje ďalšie kroky a zároveň získavajú informácie z externých zdrojov. Na rozdiel od statických vzorov „vyhľadaj a potom čítaj“ zahŕňa Agentic RAG iteratívne volania LLM, prerušované volaniami nástrojov alebo funkcií a štruktúrovanými výstupmi. Systém hodnotí výsledky, vylepšuje dopyty, v prípade potreby vyvoláva ďalšie nástroje a pokračuje v tomto cykle, kým sa nedosiahne uspokojivé riešenie. Tento iteratívny štýl „maker-checker“ zlepšuje správnosť, spracováva nesprávne formulované dopyty a zabezpečuje vysokú kvalitu výsledkov.

Systém aktívne vlastní svoj proces uvažovania, prepíše neúspešné dopyty, vyberie rôzne metódy vyhľadávania a integruje viacero nástrojov – napríklad vyhľadávanie vektorov v Azure AI Search, SQL databázy alebo vlastné API – pred finálnym zodpovedaním otázky. Rozlišovacou kvalitou agentického systému je jeho schopnosť vlastniť svoj proces uvažovania. Tradičné implementácie RAG sa spoliehajú na vopred definované cesty, ale agentický systém samostatne určuje poradie krokov na základe kvality nájdených informácií.

Definovanie Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) je vznikajúca paradigma vo vývoji AI, kde LLM nielen získavajú informácie z externých dátových zdrojov, ale tiež samostatne plánujú svoje ďalšie kroky. Na rozdiel od statických vzorov „vyhľadaj a potom čítaj“ alebo starostlivo naplánovaných postupov promptov, Agentic RAG zahŕňa slučku iteratívnych volaní LLM prerušovaných volaniami nástrojov alebo funkcií a štruktúrovaných výstupov. Systém na každom kroku vyhodnocuje získané výsledky, rozhoduje, či má upraviť svoje dopyty, vyvoláva ďalšie nástroje podľa potreby a pokračuje v tomto cykle, kým nedosiahne uspokojivé riešenie.

Tento iteratívny štýl „maker-checker“ je navrhnutý na zlepšenie správnosti, spracovanie nesprávnych dopytov do štruktúrovaných databáz (napr. NL2SQL) a zaručenie vyvážených, kvalitných výsledkov. Namiesto spoliehania sa výlučne na starostlivo navrhnuté reťazce promptov systém aktívne vlastní svoj proces uvažovania. Môže prepísať neúspešné dopyty, vybrať inú metódu vyhľadávania a integrovať viacero nástrojov – ako napríklad vyhľadávanie vektorov v Azure AI Search, SQL databázy alebo vlastné API – pred finálnym zodpovedaním. Tým sa eliminuje potreba príliš zložitých rámcov orchestrace. Namiesto toho relatívne jednoduchá slučka „volanie LLM → použitie nástroja → volanie LLM → …“ môže priniesť sofistikované a dobre podložené výstupy.

Agentic RAG Core Loop

Vlastnenie procesu uvažovania

Rozlišovacou kvalitou, ktorá robí systém „agentickým“, je jeho schopnosť vlastniť svoj proces uvažovania. Tradičné implementácie RAG často závisia od ľudí, ktorí vopred definujú cestu pre model: prístupový reťazec, ktorý určuje, čo a kedy sa má vyhľadať.
Keď je však systém naozaj agentický, interne rozhoduje, ako pristúpiť k problému. Nedá sa to považovať len za vykonávanie skriptu; autonómne určuje poradie krokov na základe kvality nájdených informácií.
Napríklad, ak je požiadaný o vytvorenie stratégie uvedenia produktu na trh, nespolieha sa výlučne na prompt, ktorý určuje celý výskumný a rozhodovací proces. Namiesto toho agentický model nezávisle rozhoduje o:

  1. Získaní aktuálnych správ o trendoch na trhu pomocou Bing Web Grounding
  2. Identifikácií relevantných údajov konkurencie pomocou Azure AI Search.
  3. Korelácií historických interných predajných metrík pomocou Azure SQL Database.
  4. Syntéze zistení do súdržnej stratégie koordinovanej prostredníctvom Azure OpenAI Service.
  5. Vyhodnotení stratégie z hľadiska medzier alebo nesúladu, prípadne iniciovaní ďalšieho kola vyhľadávania.
    Všetky tieto kroky – vylepšovanie dopytov, výber zdrojov, iterácie až do dosiahnutia „uspokojivosti“ odpovede – sú rozhodnuté modelom, nie vopred napísané človekom.

Iteratívne slučky, integrácia nástrojov a pamäť

Tool Integration Architecture

Agentický systém sa spolieha na vzor interakcie so slučkou:

V priebehu času to vytvára dojem vyvíjajúceho sa porozumenia, ktoré umožňuje modelu navigovať komplexné, viacstupňové úlohy bez potreby, aby človek neustále zasahoval alebo preformulovával prompt.

Riešenie režimov zlyhania a sebaopravovanie

Autonómia Agentic RAG zahŕňa aj robustné mechanizmy sebaopravovania. Keď systém narazí na slepé uličky – napríklad pri vyhľadávaní irelevantných dokumentov alebo obdržaní nesprávne formulovaných dopytov – môže:

Tento iteratívny a dynamický prístup umožňuje modelu neustále sa zlepšovať a zabezpečuje, že nejde len o jednorazový systém, ale o taký, ktorý sa učí zo svojich chýb počas relácie.

Self Correction Mechanism

Hranice agentnosti

Napriek svojej autonómii v rámci úlohy Agentic RAG nie je analogický k všeobecnej umelej inteligencii. Jeho „agentické“ schopnosti sú obmedzené na nástroje, dátové zdroje a pravidlá, ktoré mu poskytnú ľudskí vývojári. Nedokáže si vymyslieť vlastné nástroje ani vystúpiť mimo nastavené doménové hranice. Skôr vyniká v dynamickej koordinácii dostupných zdrojov.
Kľúčové rozdiely oproti pokročilejším formám AI zahŕňajú:

  1. Doménovo špecifická autonómia: Agentic RAG systémy sa zameriavajú na dosahovanie používateľom definovaných cieľov v rámci známej domény, používajúc stratégie ako prepisovanie dopytov alebo výber nástrojov na zlepšenie výsledkov.
  2. Závislosť na infraštruktúre: Schopnosti systému závisia od nástrojov a dát integrovaných vývojármi. Bez ľudského zásahu nemôže prekročiť tieto hranice.
  3. Rešpektovanie bezpečnostných opatrení: Etické smernice, pravidlá súladu a obchodné politiky zostávajú veľmi dôležité. Sloboda agenta je vždy obmedzená bezpečnostnými opatreniami a dohľadovými mechanizmami (dúfajme?).

Praktické použitia a hodnota

Agentic RAG vyniká v scenároch vyžadujúcich iteratívne vylepšovanie a presnosť:

  1. Prostredia zamerané na správnosť: Pri kontrolách súladu, regulačných analýzach alebo právnom výskume môže agentický model opakovane overovať fakty, konzultovať viaceré zdroje a prepísať dopyty, kým nevygeneruje dôkladne preverené odpovede.
  2. Komplexné interakcie s databázami: Pri práci so štruktúrovanými dátami, kde dopyty často zlyhávajú alebo potrebujú úpravu, systém môže autonómne vylepšovať svoje dopyty pomocou Azure SQL alebo Microsoft Fabric OneLake, čím zaručí, že konečné vyhľadávanie zodpovedá zámeru používateľa.
  3. Rozšírené pracovné postupy: Dlhšie relácie môžu evolvovať v čase, ako sa objavujú nové informácie. Agentic RAG môže neustále začleňovať nové dáta a meniť stratégie podľa toho, ako sa učí viac o probléme.

Správa, transparentnosť a dôvera

Ako sa tieto systémy stávajú v uvažovaní autonómnejšími, správa a transparentnosť sú kľúčové:

Mať nástroje, ktoré poskytujú jasný záznam o akciách, je nevyhnutné. Bez nich môže byť ladenie viacstupňového procesu veľmi náročné. Pozrite si nasledujúci príklad od Literal AI (spoločnosti za Chainlit) pre beh agenta:

AgentRunExample

Záver

Agentic RAG predstavuje prirodzenú evolúciu v tom, ako AI systémy zvládajú komplexné úlohy náročné na dáta. Prijatím vzoru interakcie so slučkou, autonómnym výberom nástrojov a vylepšovaním dopytov až do dosiahnutia kvalitného výsledku systém presahuje statické sledovanie promptov a mení sa na adaptívnejšieho, kontextovo uvedomelého rozhodovateľa. Hoci je stále viazaný na infraštruktúru a etické smernice definované ľuďmi, tieto agentické schopnosti umožňujú bohatšie, dynamickejšie a nakoniec užitočnejšie AI interakcie pre podniky aj koncových používateľov.

Máte viac otázok o Agentic RAG?

Pridajte sa k Microsoft Foundry Discord, kde sa môžete stretnúť s ďalšími študentmi, zúčastniť sa konzultačných hodín a získať odpovede na svoje otázky o AI agentoch.

Dodatočné zdroje

Akademické články

Predchádzajúca lekcia

Tool Use Design Pattern

Nasledujúca lekcia

Budovanie dôveryhodných AI agentov


Zrieknutie sa zodpovednosti:
Tento dokument bol preložený pomocou AI prekladateľskej služby Co-op Translator. Hoci sa snažíme o presnosť, vezmite prosím na vedomie, že automatické preklady môžu obsahovať chyby alebo nepresnosti. Originálny dokument v jeho pôvodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre dôležité informácie sa odporúča profesionálny ľudský preklad. Nie sme zodpovední za akékoľvek nedorozumenia alebo nesprávne interpretácie vyplývajúce z použitia tohto prekladu.