ai-agents-for-beginners

Agentic RAG

(Kliknite na obrázok vyššie a pozrite si video k tejto lekcii)

Agentic RAG

Táto lekcia poskytuje komplexný prehľad o Agentic Retrieval-Augmented Generation (Agentic RAG), novom AI paradigme, kde veľké jazykové modely (LLMs) autonómne plánujú svoje ďalšie kroky a zároveň získavajú informácie z externých zdrojov. Na rozdiel od statických vzorcov „získaj a čítaj“ Agentic RAG zahŕňa iteratívne volania LLM, ktoré sa striedajú s volaniami nástrojov alebo funkcií a štruktúrovanými výstupmi. Systém vyhodnocuje výsledky, upravuje dotazy, v prípade potreby používa ďalšie nástroje a pokračuje v tomto cykle, kým nedosiahne uspokojivé riešenie.

Úvod

Táto lekcia pokryje:

Ciele učenia

Po absolvovaní tejto lekcie budete vedieť/rozumieť:

Čo je Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) je nový AI paradigma, kde veľké jazykové modely (LLMs) autonómne plánujú svoje ďalšie kroky a získavajú informácie z externých zdrojov. Na rozdiel od statických vzorcov „získaj a čítaj“ Agentic RAG zahŕňa iteratívne volania LLM, ktoré sa striedajú s volaniami nástrojov alebo funkcií a štruktúrovanými výstupmi. Systém vyhodnocuje výsledky, upravuje dotazy, v prípade potreby používa ďalšie nástroje a pokračuje v tomto cykle, kým nedosiahne uspokojivé riešenie. Tento iteratívny štýl „maker-checker“ zlepšuje správnosť, rieši chybné dotazy a zabezpečuje vysokokvalitné výsledky.

Systém aktívne vlastní svoj proces uvažovania, prepisuje neúspešné dotazy, volí rôzne metódy získavania informácií a integruje viaceré nástroje—ako napríklad vektorové vyhľadávanie v Azure AI Search, SQL databázy alebo vlastné API—predtým, než dokončí svoju odpoveď. Rozlišujúcou kvalitou agentického systému je jeho schopnosť vlastniť proces uvažovania. Tradičné implementácie RAG sa spoliehajú na preddefinované cesty, ale agentický systém autonómne určuje sekvenciu krokov na základe kvality informácií, ktoré nájde.

Definícia Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) je nový AI paradigma, kde LLMs nielen získavajú informácie z externých dátových zdrojov, ale aj autonómne plánujú svoje ďalšie kroky. Na rozdiel od statických vzorcov „získaj a čítaj“ alebo starostlivo skriptovaných sekvencií promptov Agentic RAG zahŕňa cyklus iteratívnych volaní LLM, ktoré sa striedajú s volaniami nástrojov alebo funkcií a štruktúrovanými výstupmi. Na každom kroku systém vyhodnocuje získané výsledky, rozhoduje, či upraví dotazy, používa ďalšie nástroje, ak je to potrebné, a pokračuje v tomto cykle, kým nedosiahne uspokojivé riešenie.

Tento iteratívny štýl „maker-checker“ je navrhnutý na zlepšenie správnosti, riešenie chybných dotazov do štruktúrovaných databáz (napr. NL2SQL) a zabezpečenie vyvážených, vysokokvalitných výsledkov. Namiesto spoliehania sa výlučne na starostlivo navrhnuté reťazce promptov systém aktívne vlastní svoj proces uvažovania. Môže prepisovať neúspešné dotazy, voliť rôzne metódy získavania informácií a integrovať viaceré nástroje—ako napríklad vektorové vyhľadávanie v Azure AI Search, SQL databázy alebo vlastné API—predtým, než dokončí svoju odpoveď. To eliminuje potrebu príliš komplexných orchestrálnych rámcov. Namiesto toho relatívne jednoduchý cyklus „volanie LLM → použitie nástroja → volanie LLM → …“ môže priniesť sofistikované a dobre podložené výstupy.

Agentic RAG Core Loop

Vlastníctvo procesu uvažovania

Rozlišujúcou kvalitou, ktorá robí systém „agentickým“, je jeho schopnosť vlastniť proces uvažovania. Tradičné implementácie RAG často závisia od toho, že ľudia preddefinujú cestu pre model: reťazec myšlienok, ktorý určuje, čo získať a kedy.
Ale keď je systém skutočne agentický, rozhoduje interne, ako pristupovať k problému. Nevykonáva len skript; autonómne určuje sekvenciu krokov na základe kvality informácií, ktoré nájde.
Napríklad, ak je požiadaný o vytvorenie stratégie uvedenia produktu na trh, nespolieha sa výlučne na prompt, ktorý podrobne opisuje celý výskum a rozhodovací pracovný postup. Namiesto toho agentický model nezávisle rozhodne:

  1. Získať aktuálne správy o trendoch na trhu pomocou Bing Web Grounding.
  2. Identifikovať relevantné údaje o konkurencii pomocou Azure AI Search.
  3. Korelovať historické interné predajné metriky pomocou Azure SQL Database.
  4. Syntetizovať zistenia do ucelenej stratégie orchestrovanej cez Azure OpenAI Service.
  5. Vyhodnotiť stratégiu z hľadiska medzier alebo nekonzistencií, čo môže vyvolať ďalšie kolo získavania informácií.

Všetky tieto kroky—upravovanie dotazov, výber zdrojov, iterácia až do „spokojnosti“ s odpoveďou—sú rozhodnuté modelom, nie predskriptované človekom.

Iteratívne cykly, integrácia nástrojov a pamäť

Tool Integration Architecture

Agentický systém sa spolieha na vzorec interakcie v cykloch:

Postupom času to vytvára pocit vyvíjajúceho sa porozumenia, čo umožňuje modelu navigovať komplexné, viacstupňové úlohy bez potreby neustáleho zásahu človeka alebo preformulovania promptu.

Riešenie zlyhaní a samokorekcia

Autonómia Agentic RAG zahŕňa aj robustné mechanizmy samokorekcie. Keď systém narazí na slepé uličky—ako napríklad získanie irelevantných dokumentov alebo narazenie na chybné dotazy—môže:

Tento iteratívny a dynamický prístup umožňuje modelu neustále sa zlepšovať, čím zabezpečuje, že nie je len jednorazovým systémom, ale takým, ktorý sa učí zo svojich chýb počas danej relácie.

Self Correction Mechanism

Hranice autonómie

Napriek svojej autonómii v rámci úlohy Agentic RAG nie je ekvivalentom všeobecnej umelej inteligencie. Jeho „agentické“ schopnosti sú obmedzené na nástroje, dátové zdroje a politiky poskytované ľudskými vývojármi. Nemôže si vymýšľať vlastné nástroje ani prekračovať hranice domény, ktoré boli nastavené. Skôr exceluje v dynamickom orchestrálnom využívaní dostupných zdrojov.
Kľúčové rozdiely oproti pokročilejším formám AI zahŕňajú:

  1. Autonómia špecifická pre doménu: Systémy Agentic RAG sú zamerané na dosiahnutie cieľov definovaných používateľom v známej doméne, pričom používajú stratégie ako prepisovanie dotazov alebo výber nástrojov na zlepšenie výsledkov.
  2. Závislosť od infraštruktúry: Schopnosti systému závisia od nástrojov a dát integrovaných vývojármi. Nemôže prekročiť tieto hranice bez zásahu človeka.
  3. Rešpektovanie bezpečnostných opatrení: Etické smernice, pravidlá súladu a obchodné politiky zostávajú veľmi dôležité. Sloboda agenta je vždy obmedzená bezpečnostnými opatreniami a mechanizmami dohľadu (dúfajme).

Praktické prípady použitia a hodnota

Agentic RAG exceluje v scenároch vyžadujúcich iteratívne zdokonaľovanie a presnosť:

  1. Prostredia orientované na správnosť: Pri kontrolách súladu, regulačnej analýze alebo právnom výskume môže agentický model opakovane overovať fakty, konzultovať viaceré zdroje a prepisovať dotazy, kým neprodukuje dôkladne overenú odpoveď.
  2. Komplexné interakcie s databázami: Pri práci so štruktúrovanými údajmi, kde dotazy často zlyhávajú alebo potrebujú úpravu, systém môže autonómne upravovať svoje dotazy pomocou Azure SQL alebo Microsoft Fabric OneLake, čím zabezpečí, že konečné získanie údajov zodpovedá zámeru používateľa.
  3. Rozšírené pracovné postupy: Dlhšie relácie sa môžu vyvíjať, keď sa objavia nové informácie. Agentic RAG môže neustále začleňovať nové údaje, meniť stratégie, keď sa dozvie viac o problematike.

Riadenie, transparentnosť a dôvera

Ako sa tieto systémy stávajú autonómnejšími vo svojom uvažovaní, riadenie a transparentnosť sú kľúčové:

Mať nástroje, ktoré poskytujú jasný záznam o akciách, je nevyhnutné. Bez nich môže byť ladenie viacstupňového procesu veľmi náročné. Pozrite si nasledujúci príklad

Akademické články

Predchádzajúca lekcia

Šablóna dizajnu pre používanie nástrojov

Nasledujúca lekcia

Budovanie dôveryhodných AI agentov


Upozornenie:
Tento dokument bol preložený pomocou služby AI prekladu Co-op Translator. Hoci sa snažíme o presnosť, prosím, berte na vedomie, že automatizované preklady môžu obsahovať chyby alebo nepresnosti. Pôvodný dokument v jeho rodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre kritické informácie sa odporúča profesionálny ľudský preklad. Nenesieme zodpovednosť za akékoľvek nedorozumenia alebo nesprávne interpretácie vyplývajúce z použitia tohto prekladu.