ai-agents-for-beginners

Agentic RAG

(Kliknite na obrázok vyššie a pozrite si video k tejto lekcii)

Agentic RAG

Táto lekcia poskytuje komplexný prehľad o Agentic Retrieval-Augmented Generation (Agentic RAG), novom AI prístupe, kde veľké jazykové modely (LLMs) autonómne plánujú svoje ďalšie kroky a zároveň získavajú informácie z externých zdrojov. Na rozdiel od statických vzorcov „získaj a čítaj“, Agentic RAG zahŕňa iteratívne volania LLM, ktoré sú prepojené s volaniami nástrojov alebo funkcií a štruktúrovanými výstupmi. Systém vyhodnocuje výsledky, upravuje dotazy, aktivuje ďalšie nástroje, ak je to potrebné, a pokračuje v tomto cykle, kým nedosiahne uspokojivé riešenie.

Úvod

Táto lekcia pokryje:

Ciele učenia

Po absolvovaní tejto lekcie budete vedieť/rozumieť:

Čo je Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) je nový prístup v AI, kde veľké jazykové modely (LLMs) autonómne plánujú svoje ďalšie kroky a zároveň získavajú informácie z externých zdrojov. Na rozdiel od statických vzorcov „získaj a čítaj“, Agentic RAG zahŕňa iteratívne volania LLM, ktoré sú prepojené s volaniami nástrojov alebo funkcií a štruktúrovanými výstupmi. Systém vyhodnocuje výsledky, upravuje dotazy, aktivuje ďalšie nástroje, ak je to potrebné, a pokračuje v tomto cykle, kým nedosiahne uspokojivé riešenie. Tento iteratívny štýl „maker-checker“ zlepšuje správnosť, rieši chybné dotazy a zabezpečuje vysokú kvalitu výsledkov.

Systém aktívne vlastní svoj proces uvažovania, prepisuje neúspešné dotazy, volí rôzne metódy získavania informácií a integruje viaceré nástroje—ako napríklad vektorové vyhľadávanie v Azure AI Search, SQL databázy alebo vlastné API—predtým, než dokončí svoju odpoveď. Rozlišujúcou kvalitou agentického systému je jeho schopnosť vlastniť proces uvažovania. Tradičné implementácie RAG sa spoliehajú na preddefinované cesty, ale agentický systém autonómne určuje postupnosť krokov na základe kvality informácií, ktoré nájde.

Definícia Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) je nový prístup vo vývoji AI, kde LLMs nielen získavajú informácie z externých zdrojov, ale aj autonómne plánujú svoje ďalšie kroky. Na rozdiel od statických vzorcov „získaj a čítaj“ alebo starostlivo skriptovaných sekvencií promptov, Agentic RAG zahŕňa cyklus iteratívnych volaní LLM, prepojených s volaniami nástrojov alebo funkcií a štruktúrovanými výstupmi. V každom kroku systém vyhodnocuje získané výsledky, rozhoduje, či upraví dotazy, aktivuje ďalšie nástroje, ak je to potrebné, a pokračuje v tomto cykle, kým nedosiahne uspokojivé riešenie.

Tento iteratívny štýl „maker-checker“ je navrhnutý na zlepšenie správnosti, riešenie chybných dotazov do štruktúrovaných databáz (napr. NL2SQL) a zabezpečenie vyvážených, vysokokvalitných výsledkov. Namiesto spoliehania sa výlučne na starostlivo navrhnuté sekvencie promptov systém aktívne vlastní svoj proces uvažovania. Môže prepisovať neúspešné dotazy, voliť rôzne metódy získavania informácií a integrovať viaceré nástroje—ako napríklad vektorové vyhľadávanie v Azure AI Search, SQL databázy alebo vlastné API—predtým, než dokončí svoju odpoveď. To eliminuje potrebu príliš komplexných orchestrálnych rámcov. Namiesto toho relatívne jednoduchý cyklus „volanie LLM → použitie nástroja → volanie LLM → …“ môže priniesť sofistikované a dobre podložené výstupy.

Agentic RAG Core Loop

Vlastníctvo procesu uvažovania

Rozlišujúcou kvalitou, ktorá robí systém „agentickým“, je jeho schopnosť vlastniť proces uvažovania. Tradičné implementácie RAG často závisia od toho, že ľudia preddefinujú cestu pre model: reťaz myšlienok, ktorá určuje, čo získať a kedy. Ale keď je systém skutočne agentický, rozhoduje interne, ako pristupovať k problému. Nevykonáva len skript; autonómne určuje postupnosť krokov na základe kvality informácií, ktoré nájde.

Napríklad, ak je požiadaný o vytvorenie stratégie uvedenia produktu na trh, nespolieha sa výlučne na prompt, ktorý podrobne opisuje celý výskum a rozhodovací proces. Namiesto toho agentický model nezávisle rozhodne:

  1. Získať aktuálne správy o trendoch na trhu pomocou Bing Web Grounding.
  2. Identifikovať relevantné údaje o konkurencii pomocou Azure AI Search.
  3. Korelovať historické interné predajné metriky pomocou Azure SQL Database.
  4. Syntetizovať zistenia do ucelenej stratégie orchestrálnej cez Azure OpenAI Service.
  5. Vyhodnotiť stratégiu na medzery alebo nekonzistencie, čo môže vyvolať ďalšie kolo získavania informácií.

Všetky tieto kroky—upravovanie dotazov, výber zdrojov, iterácia, kým je „spokojný“ s odpoveďou—sú rozhodnuté modelom, nie predskriptované človekom.

Iteratívne cykly, integrácia nástrojov a pamäť

Tool Integration Architecture

Agentický systém sa spolieha na vzorec interakcie v cykloch:

Postupom času to vytvára pocit vyvíjajúceho sa porozumenia, čo umožňuje modelu navigovať komplexné, viacstupňové úlohy bez potreby neustáleho zásahu človeka alebo preformulovania promptu.

Riešenie zlyhaní a samokorekcia

Autonómia Agentic RAG zahŕňa aj robustné mechanizmy samokorekcie. Keď systém narazí na slepé uličky—ako napríklad získanie irelevantných dokumentov alebo narazenie na chybné dotazy—môže:

Tento iteratívny a dynamický prístup umožňuje modelu neustále sa zlepšovať, čím zabezpečuje, že nie je len jednorazovým systémom, ale takým, ktorý sa učí zo svojich chýb počas danej relácie.

Self Correction Mechanism

Hranice autonómie

Napriek svojej autonómii v rámci úlohy Agentic RAG nie je ekvivalentom všeobecnej umelej inteligencie. Jeho „agentické“ schopnosti sú obmedzené na nástroje, zdroje údajov a politiky poskytované ľudskými vývojármi. Nemôže si vymyslieť vlastné nástroje ani prekročiť hranice domény, ktoré boli nastavené. Skôr exceluje v dynamickom orchestrálnom využívaní dostupných zdrojov.

Kľúčové rozdiely oproti pokročilejším formám AI zahŕňajú:

  1. Autonómia špecifická pre danú oblasť: Systémy Agentic RAG sú zamerané na dosiahnutie cieľov definovaných používateľom v známej oblasti, pričom využívajú stratégie ako prepisovanie dotazov alebo výber nástrojov na zlepšenie výsledkov.
  2. Závislosť od infraštruktúry: Schopnosti systému závisia od nástrojov a údajov integrovaných vývojármi. Nemôže prekročiť tieto hranice bez zásahu človeka.
  3. Rešpektovanie bezpečnostných opatrení: Etické smernice, pravidlá súladu a obchodné politiky zostávajú veľmi dôležité. Sloboda agenta je vždy obmedzená bezpečnostnými opatreniami a mechanizmami dohľadu (dúfajme?).

Praktické použitie a hodnota

Agentic RAG exceluje v scenároch vyžadujúcich iteratívne zdokonaľovanie a presnosť:

  1. Prostredia zamerané na správnosť: Pri kontrolách súladu, regulačnej analýze alebo právnom výskume môže agentický model opakovane overovať fakty, konzultovať viaceré zdroje a prepisovať dotazy, kým neprodukuje dôkladne overenú odpoveď.
  2. Komplexné interakcie s databázami: Pri práci so štruktúrovanými údajmi, kde dotazy často zlyhávajú alebo potrebujú úpravu, systém môže autonómne upravovať svoje dotazy pomocou Azure SQL alebo Microsoft Fabric OneLake, čím zabezpečí, že konečné získanie údajov zodpovedá zámeru používateľa.
  3. Rozšírené pracovné postupy: Dlhšie relácie sa môžu vyvíjať, keď sa objavia nové informácie. Agentic RAG môže neustále začleňovať nové údaje, meniť stratégie, keď sa dozvie viac o problematike.

Riadenie, transparentnosť a dôvera

Ako sa tieto systémy stávajú autonómnejšími vo svojom uvažovaní, riadenie a transparentnosť sú kľúčové:

Mať nástroje, ktoré poskytujú jasný záznam o akciách, je nevyhnutné. Bez nich môže byť ladenie viacstupňového procesu veľmi náročné. Pozrite si nasledujúci Implementácia Retrieval Augmented Generation (RAG) s Azure OpenAI Service: Naučte sa, ako používať vlastné dáta s Azure OpenAI Service. Tento modul Microsoft Learn poskytuje komplexný návod na implementáciu RAG

Akademické články

Predchádzajúca lekcia

Tool Use Design Pattern

Nasledujúca lekcia

Building Trustworthy AI Agents


Upozornenie:
Tento dokument bol preložený pomocou služby AI prekladu Co-op Translator. Hoci sa snažíme o presnosť, prosím, berte na vedomie, že automatizované preklady môžu obsahovať chyby alebo nepresnosti. Pôvodný dokument v jeho rodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre kritické informácie sa odporúča profesionálny ľudský preklad. Nie sme zodpovední za akékoľvek nedorozumenia alebo nesprávne interpretácie vyplývajúce z použitia tohto prekladu.