
(Kliknite na obrázok vyššie a pozrite si video k tejto lekcii)
Agentic RAG
Táto lekcia poskytuje komplexný prehľad o Agentic Retrieval-Augmented Generation (Agentic RAG), novom AI prístupe, kde veľké jazykové modely (LLMs) autonómne plánujú svoje ďalšie kroky a zároveň získavajú informácie z externých zdrojov. Na rozdiel od statických vzorcov „získaj a čítaj“, Agentic RAG zahŕňa iteratívne volania LLM, ktoré sú prepojené s volaniami nástrojov alebo funkcií a štruktúrovanými výstupmi. Systém vyhodnocuje výsledky, upravuje dotazy, aktivuje ďalšie nástroje, ak je to potrebné, a pokračuje v tomto cykle, kým nedosiahne uspokojivé riešenie.
Úvod
Táto lekcia pokryje:
- Porozumenie Agentic RAG: Naučte sa o novom prístupe v AI, kde veľké jazykové modely (LLMs) autonómne plánujú svoje ďalšie kroky a získavajú informácie z externých zdrojov.
- Iteratívny štýl Maker-Checker: Pochopte cyklus iteratívnych volaní LLM, prepojených s volaniami nástrojov alebo funkcií a štruktúrovanými výstupmi, navrhnutý na zlepšenie správnosti a riešenie chybných dotazov.
- Preskúmanie praktických aplikácií: Identifikujte scenáre, kde Agentic RAG exceluje, ako napríklad prostredia zamerané na správnosť, komplexné interakcie s databázami a rozšírené pracovné postupy.
Ciele učenia
Po absolvovaní tejto lekcie budete vedieť/rozumieť:
- Porozumenie Agentic RAG: Naučte sa o novom prístupe v AI, kde veľké jazykové modely (LLMs) autonómne plánujú svoje ďalšie kroky a získavajú informácie z externých zdrojov.
- Iteratívny štýl Maker-Checker: Pochopte koncept cyklu iteratívnych volaní LLM, prepojených s volaniami nástrojov alebo funkcií a štruktúrovanými výstupmi, navrhnutý na zlepšenie správnosti a riešenie chybných dotazov.
- Vlastníctvo procesu uvažovania: Pochopte schopnosť systému vlastniť proces uvažovania, robiť rozhodnutia o tom, ako pristupovať k problémom bez spoliehania sa na preddefinované cesty.
- Pracovný postup: Pochopte, ako agentický model nezávisle rozhoduje o získavaní správ o trendoch na trhu, identifikácii údajov o konkurencii, korelácii interných predajných metrík, syntéze zistení a hodnotení stratégie.
- Iteratívne cykly, integrácia nástrojov a pamäť: Naučte sa o závislosti systému na vzorci interakcie v cykloch, udržiavaní stavu a pamäte medzi krokmi, aby sa predišlo opakovaniu cyklov a robili informované rozhodnutia.
- Riešenie zlyhaní a samokorekcia: Preskúmajte robustné mechanizmy samokorekcie systému, vrátane iterácie a opätovného dotazovania, používania diagnostických nástrojov a spoliehania sa na ľudský dohľad.
- Hranice autonómie: Pochopte obmedzenia Agentic RAG, zamerané na autonómiu špecifickú pre danú oblasť, závislosť od infraštruktúry a rešpektovanie bezpečnostných opatrení.
- Praktické použitie a hodnota: Identifikujte scenáre, kde Agentic RAG exceluje, ako napríklad prostredia zamerané na správnosť, komplexné interakcie s databázami a rozšírené pracovné postupy.
- Riadenie, transparentnosť a dôvera: Naučte sa o dôležitosti riadenia a transparentnosti, vrátane vysvetliteľného uvažovania, kontroly zaujatosti a ľudského dohľadu.
Čo je Agentic RAG?
Agentic Retrieval-Augmented Generation (Agentic RAG) je nový prístup v AI, kde veľké jazykové modely (LLMs) autonómne plánujú svoje ďalšie kroky a zároveň získavajú informácie z externých zdrojov. Na rozdiel od statických vzorcov „získaj a čítaj“, Agentic RAG zahŕňa iteratívne volania LLM, ktoré sú prepojené s volaniami nástrojov alebo funkcií a štruktúrovanými výstupmi. Systém vyhodnocuje výsledky, upravuje dotazy, aktivuje ďalšie nástroje, ak je to potrebné, a pokračuje v tomto cykle, kým nedosiahne uspokojivé riešenie. Tento iteratívny štýl „maker-checker“ zlepšuje správnosť, rieši chybné dotazy a zabezpečuje vysokú kvalitu výsledkov.
Systém aktívne vlastní svoj proces uvažovania, prepisuje neúspešné dotazy, volí rôzne metódy získavania informácií a integruje viaceré nástroje—ako napríklad vektorové vyhľadávanie v Azure AI Search, SQL databázy alebo vlastné API—predtým, než dokončí svoju odpoveď. Rozlišujúcou kvalitou agentického systému je jeho schopnosť vlastniť proces uvažovania. Tradičné implementácie RAG sa spoliehajú na preddefinované cesty, ale agentický systém autonómne určuje postupnosť krokov na základe kvality informácií, ktoré nájde.
Definícia Agentic Retrieval-Augmented Generation (Agentic RAG)
Agentic Retrieval-Augmented Generation (Agentic RAG) je nový prístup vo vývoji AI, kde LLMs nielen získavajú informácie z externých zdrojov, ale aj autonómne plánujú svoje ďalšie kroky. Na rozdiel od statických vzorcov „získaj a čítaj“ alebo starostlivo skriptovaných sekvencií promptov, Agentic RAG zahŕňa cyklus iteratívnych volaní LLM, prepojených s volaniami nástrojov alebo funkcií a štruktúrovanými výstupmi. V každom kroku systém vyhodnocuje získané výsledky, rozhoduje, či upraví dotazy, aktivuje ďalšie nástroje, ak je to potrebné, a pokračuje v tomto cykle, kým nedosiahne uspokojivé riešenie.
Tento iteratívny štýl „maker-checker“ je navrhnutý na zlepšenie správnosti, riešenie chybných dotazov do štruktúrovaných databáz (napr. NL2SQL) a zabezpečenie vyvážených, vysokokvalitných výsledkov. Namiesto spoliehania sa výlučne na starostlivo navrhnuté sekvencie promptov systém aktívne vlastní svoj proces uvažovania. Môže prepisovať neúspešné dotazy, voliť rôzne metódy získavania informácií a integrovať viaceré nástroje—ako napríklad vektorové vyhľadávanie v Azure AI Search, SQL databázy alebo vlastné API—predtým, než dokončí svoju odpoveď. To eliminuje potrebu príliš komplexných orchestrálnych rámcov. Namiesto toho relatívne jednoduchý cyklus „volanie LLM → použitie nástroja → volanie LLM → …“ môže priniesť sofistikované a dobre podložené výstupy.

Vlastníctvo procesu uvažovania
Rozlišujúcou kvalitou, ktorá robí systém „agentickým“, je jeho schopnosť vlastniť proces uvažovania. Tradičné implementácie RAG často závisia od toho, že ľudia preddefinujú cestu pre model: reťaz myšlienok, ktorá určuje, čo získať a kedy. Ale keď je systém skutočne agentický, rozhoduje interne, ako pristupovať k problému. Nevykonáva len skript; autonómne určuje postupnosť krokov na základe kvality informácií, ktoré nájde.
Napríklad, ak je požiadaný o vytvorenie stratégie uvedenia produktu na trh, nespolieha sa výlučne na prompt, ktorý podrobne opisuje celý výskum a rozhodovací proces. Namiesto toho agentický model nezávisle rozhodne:
- Získať aktuálne správy o trendoch na trhu pomocou Bing Web Grounding.
- Identifikovať relevantné údaje o konkurencii pomocou Azure AI Search.
- Korelovať historické interné predajné metriky pomocou Azure SQL Database.
- Syntetizovať zistenia do ucelenej stratégie orchestrálnej cez Azure OpenAI Service.
- Vyhodnotiť stratégiu na medzery alebo nekonzistencie, čo môže vyvolať ďalšie kolo získavania informácií.
Všetky tieto kroky—upravovanie dotazov, výber zdrojov, iterácia, kým je „spokojný“ s odpoveďou—sú rozhodnuté modelom, nie predskriptované človekom.
Iteratívne cykly, integrácia nástrojov a pamäť

Agentický systém sa spolieha na vzorec interakcie v cykloch:
- Počiatočné volanie: Cieľ používateľa (t.j. používateľský prompt) je prezentovaný LLM.
- Aktivácia nástroja: Ak model identifikuje chýbajúce informácie alebo nejasné pokyny, vyberie nástroj alebo metódu získavania informácií—ako napríklad dotaz na vektorovú databázu (napr. Azure AI Search Hybrid search nad súkromnými údajmi) alebo štruktúrované volanie SQL—na získanie ďalšieho kontextu.
- Hodnotenie a úprava: Po preskúmaní vrátených údajov model rozhodne, či informácie postačujú. Ak nie, upraví dotaz, vyskúša iný nástroj alebo prispôsobí svoj prístup.
- Opakovanie, kým je spokojný: Tento cyklus pokračuje, kým model neurčí, že má dostatok jasnosti a dôkazov na poskytnutie konečnej, dobre premyslenej odpovede.
- Pamäť a stav: Pretože systém udržiava stav a pamäť medzi krokmi, môže si spomenúť na predchádzajúce pokusy a ich výsledky, čím sa vyhne opakovaniu cyklov a robí informovanejšie rozhodnutia, ako postupuje.
Postupom času to vytvára pocit vyvíjajúceho sa porozumenia, čo umožňuje modelu navigovať komplexné, viacstupňové úlohy bez potreby neustáleho zásahu človeka alebo preformulovania promptu.
Riešenie zlyhaní a samokorekcia
Autonómia Agentic RAG zahŕňa aj robustné mechanizmy samokorekcie. Keď systém narazí na slepé uličky—ako napríklad získanie irelevantných dokumentov alebo narazenie na chybné dotazy—môže:
- Iterovať a opätovne dotazovať: Namiesto poskytovania nízko hodnotných odpovedí model skúša nové stratégie vyhľadávania, prepisuje dotazy do databázy alebo skúma alternatívne súbory údajov.
- Použiť diagnostické nástroje: Systém môže aktivovať ďalšie funkcie navrhnuté na pomoc pri ladení krokov uvažovania alebo potvrdení správnosti získaných údajov. Nástroje ako Azure AI Tracing budú dôležité na umožnenie robustnej pozorovateľnosti a monitorovania.
- Spoliehať sa na ľudský dohľad: Pre úlohy s vysokým rizikom alebo opakovane zlyhávajúce scenáre môže model označiť neistotu a požiadať o ľudské vedenie. Keď človek poskytne korektívnu spätnú väzbu, model môže túto lekciu začleniť do budúcnosti.
Tento iteratívny a dynamický prístup umožňuje modelu neustále sa zlepšovať, čím zabezpečuje, že nie je len jednorazovým systémom, ale takým, ktorý sa učí zo svojich chýb počas danej relácie.

Hranice autonómie
Napriek svojej autonómii v rámci úlohy Agentic RAG nie je ekvivalentom všeobecnej umelej inteligencie. Jeho „agentické“ schopnosti sú obmedzené na nástroje, zdroje údajov a politiky poskytované ľudskými vývojármi. Nemôže si vymyslieť vlastné nástroje ani prekročiť hranice domény, ktoré boli nastavené. Skôr exceluje v dynamickom orchestrálnom využívaní dostupných zdrojov.
Kľúčové rozdiely oproti pokročilejším formám AI zahŕňajú:
- Autonómia špecifická pre danú oblasť: Systémy Agentic RAG sú zamerané na dosiahnutie cieľov definovaných používateľom v známej oblasti, pričom využívajú stratégie ako prepisovanie dotazov alebo výber nástrojov na zlepšenie výsledkov.
- Závislosť od infraštruktúry: Schopnosti systému závisia od nástrojov a údajov integrovaných vývojármi. Nemôže prekročiť tieto hranice bez zásahu človeka.
- Rešpektovanie bezpečnostných opatrení: Etické smernice, pravidlá súladu a obchodné politiky zostávajú veľmi dôležité. Sloboda agenta je vždy obmedzená bezpečnostnými opatreniami a mechanizmami dohľadu (dúfajme?).
Praktické použitie a hodnota
Agentic RAG exceluje v scenároch vyžadujúcich iteratívne zdokonaľovanie a presnosť:
- Prostredia zamerané na správnosť: Pri kontrolách súladu, regulačnej analýze alebo právnom výskume môže agentický model opakovane overovať fakty, konzultovať viaceré zdroje a prepisovať dotazy, kým neprodukuje dôkladne overenú odpoveď.
- Komplexné interakcie s databázami: Pri práci so štruktúrovanými údajmi, kde dotazy často zlyhávajú alebo potrebujú úpravu, systém môže autonómne upravovať svoje dotazy pomocou Azure SQL alebo Microsoft Fabric OneLake, čím zabezpečí, že konečné získanie údajov zodpovedá zámeru používateľa.
- Rozšírené pracovné postupy: Dlhšie relácie sa môžu vyvíjať, keď sa objavia nové informácie. Agentic RAG môže neustále začleňovať nové údaje, meniť stratégie, keď sa dozvie viac o problematike.
Riadenie, transparentnosť a dôvera
Ako sa tieto systémy stávajú autonómnejšími vo svojom uvažovaní, riadenie a transparentnosť sú kľúčové:
- Vysvetliteľné uvažovanie: Model môže poskytnúť záznam o dotazoch, ktoré vykonal, zdrojoch, ktoré konzultoval, a krokoch uvažovania, ktoré podnikol na dosiahnutie svojho záveru. Nástroje ako Azure AI Content Safety a Azure AI Tracing / GenAIOps môžu pomôcť udržiavať transparentnosť a zmierňovať riziká.
- Kontrola zaujatosti a vyvážené získavanie: Vývojári môžu doladiť stratégie získavania informácií, aby zabezpečili, že sa zohľadnia vyvážené, reprezentatívne zdroje údajov, a pravidelne auditovať výstupy na detekciu zaujatosti alebo skreslených vzorcov pomocou vlastných modelov pre pokročilé organizácie dátovej vedy využívajúce Azure Machine Learning.
- Ľudský dohľad a súlad: Pri citlivých úlohách zostáva ľudská kontrola nevyhnutná. Agentic RAG nenahrádza ľudský úsudok pri rozhodnutiach s vysokým rizikom—dopĺňa ho tým, že poskytuje dôkladnejšie overené možnosti.
Mať nástroje, ktoré poskytujú jasný záznam o akciách, je nevyhnutné. Bez nich môže byť ladenie viacstupňového procesu veľmi náročné. Pozrite si nasledujúci
Implementácia Retrieval Augmented Generation (RAG) s Azure OpenAI Service: Naučte sa, ako používať vlastné dáta s Azure OpenAI Service. Tento modul Microsoft Learn poskytuje komplexný návod na implementáciu RAG
Akademické články
Predchádzajúca lekcia
Tool Use Design Pattern
Nasledujúca lekcia
Building Trustworthy AI Agents
Upozornenie:
Tento dokument bol preložený pomocou služby AI prekladu Co-op Translator. Hoci sa snažíme o presnosť, prosím, berte na vedomie, že automatizované preklady môžu obsahovať chyby alebo nepresnosti. Pôvodný dokument v jeho rodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre kritické informácie sa odporúča profesionálny ľudský preklad. Nie sme zodpovední za akékoľvek nedorozumenia alebo nesprávne interpretácie vyplývajúce z použitia tohto prekladu.