ai-agents-for-beginners

Agentic RAG

(Klikněte na obrázek výše pro zhlédnutí videa této lekce)

Agentic RAG

Tato lekce poskytuje komplexní přehled o Agentic Retrieval-Augmented Generation (Agentic RAG), nově vznikajícím AI paradigmatu, kde velké jazykové modely (LLMs) autonomně plánují své další kroky při získávání informací z externích zdrojů. Na rozdíl od statických vzorců „získat a přečíst“ Agentic RAG zahrnuje iterativní volání LLM, prokládané použitím nástrojů nebo funkcí a strukturovanými výstupy. Systém vyhodnocuje výsledky, zpřesňuje dotazy, v případě potřeby aktivuje další nástroje a pokračuje v tomto cyklu, dokud nedosáhne uspokojivého řešení.

Úvod

Tato lekce pokryje:

Cíle učení

Po dokončení této lekce budete vědět, jak/rozumět:

Co je Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) je nově vznikající AI paradigma, kde velké jazykové modely (LLMs) autonomně plánují své další kroky při získávání informací z externích zdrojů. Na rozdíl od statických vzorců „získat a přečíst“ Agentic RAG zahrnuje iterativní volání LLM, prokládané použitím nástrojů nebo funkcí a strukturovanými výstupy. Systém vyhodnocuje výsledky, zpřesňuje dotazy, v případě potřeby aktivuje další nástroje a pokračuje v tomto cyklu, dokud nedosáhne uspokojivého řešení. Tento iterativní styl „maker-checker“ zlepšuje správnost, řeší chybné dotazy a zajišťuje vysoce kvalitní výsledky.

Systém aktivně vlastní svůj proces uvažování, přepisuje neúspěšné dotazy, volí různé metody získávání informací a integruje více nástrojů—například vektorové vyhledávání v Azure AI Search, SQL databáze nebo vlastní API—před dokončením své odpovědi. Rozlišující kvalitou agentického systému je jeho schopnost vlastnit svůj proces uvažování. Tradiční implementace RAG se spoléhají na předem definované cesty, ale agentický systém autonomně určuje sekvenci kroků na základě kvality informací, které najde.

Definice Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) je nově vznikající paradigma ve vývoji AI, kde LLM nejen získávají informace z externích datových zdrojů, ale také autonomně plánují své další kroky. Na rozdíl od statických vzorců „získat a přečíst“ nebo pečlivě skriptovaných sekvencí promptů Agentic RAG zahrnuje smyčku iterativních volání LLM, prokládaných použitím nástrojů nebo funkcí a strukturovanými výstupy. Při každém kroku systém vyhodnocuje výsledky, které získal, rozhoduje, zda zpřesnit své dotazy, aktivuje další nástroje, pokud je to nutné, a pokračuje v tomto cyklu, dokud nedosáhne uspokojivého řešení.

Tento iterativní styl „maker-checker“ je navržen ke zlepšení správnosti, řešení chybných dotazů na strukturované databáze (např. NL2SQL) a zajištění vyvážených, vysoce kvalitních výsledků. Místo spoléhání se pouze na pečlivě navržené řetězce promptů systém aktivně vlastní svůj proces uvažování. Může přepisovat dotazy, které selhaly, volit různé metody získávání informací a integrovat více nástrojů—například vektorové vyhledávání v Azure AI Search, SQL databáze nebo vlastní API—před dokončením své odpovědi. To eliminuje potřebu příliš složitých orchestrálních rámců. Místo toho relativně jednoduchá smyčka „volání LLM → použití nástroje → volání LLM → …“ může přinést sofistikované a dobře podložené výstupy.

Agentic RAG Core Loop

Vlastnictví procesu uvažování

Rozlišující kvalitou, která činí systém „agentickým“, je jeho schopnost vlastnit svůj proces uvažování. Tradiční implementace RAG často závisí na tom, že lidé předem definují cestu pro model: řetězec myšlenek, který určuje, co získat a kdy.
Ale když je systém skutečně agentický, rozhoduje interně, jak přistupovat k problému. Nejenže vykonává skript; autonomně určuje sekvenci kroků na základě kvality informací, které najde.
Například pokud je požádán o vytvoření strategie uvedení produktu na trh, nespoléhá se pouze na prompt, který podrobně popisuje celý výzkumný a rozhodovací pracovní postup. Místo toho agentický model nezávisle rozhodne:

  1. Získat aktuální zprávy o trendech na trhu pomocí Bing Web Grounding.
  2. Identifikovat relevantní data o konkurenci pomocí Azure AI Search.
  3. Korelovat historické interní prodejní metriky pomocí Azure SQL Database.
  4. Syntetizovat zjištění do ucelené strategie orchestrované prostřednictvím Azure OpenAI Service.
  5. Vyhodnotit strategii z hlediska mezer nebo nesrovnalostí, což může vyvolat další kolo získávání informací.

Všechny tyto kroky—zpřesňování dotazů, volba zdrojů, iterace, dokud není „spokojen“ s odpovědí—jsou rozhodnutím modelu, nikoli předem skriptované člověkem.

Iterativní smyčky, integrace nástrojů a paměť

Tool Integration Architecture

Agentický systém se spoléhá na vzorec interakce ve smyčce:

Postupem času to vytváří pocit vyvíjejícího se porozumění, což umožňuje modelu navigovat složité, vícekrokové úkoly, aniž by bylo nutné, aby člověk neustále zasahoval nebo upravoval prompt.

Řešení režimů selhání a samokorekce

Autonomie Agentic RAG zahrnuje také robustní mechanismy samokorekce. Když systém narazí na slepé uličky—například získání irelevantních dokumentů nebo narazí na chybné dotazy—může:

Tento iterativní a dynamický přístup umožňuje modelu neustále se zlepšovat, což zajišťuje, že není jen jednorázovým systémem, ale systémem, který se učí ze svých chyb během dané relace.

Self Correction Mechanism

Hranice autonomie

Navzdory své autonomii v rámci úkolu Agentic RAG není analogický umělé obecné inteligenci. Jeho „agentické“ schopnosti jsou omezeny na nástroje, datové zdroje a politiky poskytované lidskými vývojáři. Nemůže si vymýšlet vlastní nástroje nebo překračovat hranice domény, které byly nastaveny. Spíše exceluje v dynamickém orchestraci dostupných zdrojů.
Klíčové rozdíly oproti pokročilejším formám AI zahrnují:

  1. Autonomie specifická pro doménu: Systémy Agentic RAG se zaměřují na dosažení cílů definovaných uživatelem v rámci známé domény, používají strategie jako přepisování dotazů nebo výběr nástrojů ke zlepšení výsledků.
  2. Závislost na infrastruktuře: Schopnosti systému závisí na nástrojích a datech integrovaných vývojáři. Nemůže překročit tyto hranice bez lidského zásahu.
  3. Respektování ochranných opatření: Etické pokyny, pravidla dodržování předpisů a obchodní politiky zůstávají velmi důležité. Svoboda agenta je vždy omezena bezpečnostními opatřeními a mechanismy dohledu (snad?).

Praktické případy použití a hodnota

Agentic RAG exceluje ve scénářích vyžadujících iterativní zpřesnění a přesnost:

  1. Prostředí zaměřená na správnost: Při kontrolách shody, analýze regulací nebo právním výzkumu může agentický model opakovaně ověřovat fakta, konzultovat více zdrojů a přepisovat dotazy, dokud neposkytne důkladně ověřenou odpověď.
  2. Komplexní interakce s databázemi: Při práci se strukturovanými daty, kde dotazy často selhávají nebo potřebují úpravy, může systém autonomně zpřesňovat své dotazy pomocí Azure SQL nebo Microsoft Fabric OneLake, což zajišťuje, že konečné získání odpovídá záměru uživatele.
  3. Rozšířené pracovní postupy: Dlouhodobé relace se mohou vyvíjet, jak se objevují nové informace. Agentic RAG může neustále začleňovat nová data, měnit strategie, jak se dozvídá více o prostoru problému.

Řízení, transparentnost a důvěra

Jak se tyto systémy stávají autonomnějšími ve svém uvažování, řízení a transparentnost jsou klíčové:

Mít nástroje, které poskytují jasný záznam akcí, je zásadní. Bez nich může být ladění vícekrokového procesu velmi obtížné. Viz následující příklad od Literal AI (společnost za Chainlit) pro běh agenta:

AgentRunExample

Závěr

Agentic RAG představuje přirozený vývoj v tom, jak AI systémy zvládají složité, datově náročné úkoly. Přijetím vzorce interakce ve smyčce, autonomním výběrem nástrojů a zpřesňováním dotazů, dokud nedosáhne vysoce kvalitního výsledku, systém překračuje statické sledování promptů a stává se adaptivnějším, kontextově uvědomělejším rozhodovacím činitelem. Přestože je stále omezen lidsky definovanými infrastrukturami a etickými pokyny, tyto agentické schopnosti umožňují bohatší, dynamičtější a nakonec užitečnější AI interakce pro podniky i koncové uživate

Akademické články

Předchozí lekce

Design Pattern pro použití nástrojů

Další lekce

Budování důvěryhodných AI agentů


Prohlášení:
Tento dokument byl přeložen pomocí služby AI pro překlady Co-op Translator. I když se snažíme o přesnost, mějte prosím na paměti, že automatizované překlady mohou obsahovat chyby nebo nepřesnosti. Původní dokument v jeho původním jazyce by měl být považován za autoritativní zdroj. Pro důležité informace doporučujeme profesionální lidský překlad. Neodpovídáme za žádná nedorozumění nebo nesprávné interpretace vyplývající z použití tohoto překladu.