ai-agents-for-beginners

Agentic RAG

(Klikněte na obrázek výše pro zobrazení videa této lekce)

Agentic RAG

Tato lekce poskytuje komplexní přehled o Agentic Retrieval-Augmented Generation (Agentic RAG), novém paradigmatu AI, kde velké jazykové modely (LLM) autonomně plánují své další kroky a zároveň čerpají informace z externích zdrojů. Na rozdíl od statických vzorů načítání a následného čtení zahrnuje Agentic RAG iterativní volání LLM, prokládané voláními nástrojů nebo funkcí a strukturovanými výstupy. Systém vyhodnocuje výsledky, zpřesňuje dotazy, v případě potřeby vyvolává další nástroje a tento cyklus opakuje, dokud nedosáhne uspokojivého řešení.

Úvod

Tato lekce pokryje

Cíle učení

Po dokončení této lekce budete vědět/jste schopen porozumět:

Co je Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) je vznikající paradigma AI, kde velké jazykové modely (LLM) autonomně plánují své další kroky, zatímco čerpají informace z externích zdrojů. Na rozdíl od statických vzorů načítání a následného čtení zahrnuje Agentic RAG iterativní volání LLM, prokládaná voláními nástrojů nebo funkcí a strukturovanými výstupy. Systém vyhodnocuje výsledky, zpřesňuje dotazy, v případě potřeby vyvolává další nástroje a tento cyklus opakuje, dokud nedosáhne uspokojivého řešení. Tento iterativní styl „maker-checker“ zlepšuje správnost, zvládá chybné dotazy a zajišťuje vysoce kvalitní výsledky.

Systém aktivně ovládá svůj proces uvažování, přepisuje neúspěšné dotazy, vybírá různé metody vyhledávání a integruje více nástrojů — jako je vektorové vyhledávání v Azure AI Search, SQL databáze nebo vlastní API — před konečným určením odpovědi. Rozlišovací vlastností agentního systému je schopnost ovládat svůj proces uvažování. Tradiční implementace RAG spoléhají na předem definované cesty, ale agentní systém autonomně stanovuje pořadí kroků na základě kvality nalezených informací.

Definice Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) je vznikající paradigma ve vývoji AI, kde LLM nejen získávají informace z externích datových zdrojů, ale také autonomně plánují své další kroky. Na rozdíl od statických vzorů načtení a následného čtení nebo pečlivě připravených sekvencí výzev zahrnuje Agentic RAG smyčku iterativních volání LLM, prokládanou voláními nástrojů nebo funkcí a strukturovanými výstupy. Systém při každém kroku vyhodnocuje dosažené výsledky, rozhoduje, zda zpřesnit dotazy, v případě potřeby vyvolá další nástroje a pokračuje v tomto cyklu, dokud nedosáhne uspokojivého řešení.

Tento iterativní styl „maker-checker“ je navržen ke zlepšení správnosti, zvládání chybných dotazů do strukturovaných databází (např. NL2SQL) a zajištění vyvážených, vysoce kvalitních výsledků. Místo spoléhání se pouze na pečlivě navržené řetězce výzev systém aktivně ovládá svůj proces uvažování. Může přepisovat dotazy, které selhaly, vybírat různé metody vyhledávání a integrovat více nástrojů — jako je vektorové vyhledávání v Azure AI Search, SQL databáze nebo vlastní API — před dokončením své odpovědi. To odstraňuje potřebu příliš složitých orchestrací. Místo toho může relativně jednoduchá smyčka „volání LLM → použití nástroje → volání LLM → …“ produkovat sofistikované a dobře podložené výstupy.

Agentic RAG Core Loop

Ovládání procesu uvažování

Rozlišující vlastností, která dělá systém „agentním“, je jeho schopnost ovládat svůj proces uvažování. Tradiční implementace RAG často závisí na tom, že lidé předem definují cestu pro model: řetězec myšlení, který určuje, co získat a kdy.
Ale když je systém opravdu agentní, rozhoduje se uvnitř, jak přistoupit k problému. Nevykonává jen skript; autonomně určuje posloupnost kroků na základě kvality nalezených informací.
Například pokud má vytvořit strategii uvedení produktu na trh, nespoléhá se pouze na výzvu, která popisuje celý výzkumný a rozhodovací proces. Místo toho agentní model samostatně rozhodne:

  1. Získat aktuální zprávy o tržních trendech pomocí Bing Web Grounding
  2. Identifikovat relevantní data o konkurenci pomocí Azure AI Search.
  3. Korelovat historické interní prodejní metriky pomocí Azure SQL Database.
  4. Syntetizovat zjištění do kohezní strategie orchestrované prostřednictvím Azure OpenAI Service.
  5. Vyhodnotit strategii na mezery nebo nekonzistence a případně vyvolat další kolo získávání dat. Všechny tyto kroky — zpřesňování dotazů, výběr zdrojů, iterace dokud není „spokojený“ s odpovědí — jsou určovány modelem, nikoli předem skriptovány člověkem.

Iterativní smyčky, integrace nástrojů a paměť

Tool Integration Architecture

Agentní systém spoléhá na vzorec smyčkových interakcí:

Časem to vytváří pocit vyvíjejícího se porozumění, umožňující modelu navigovat složité, vícestupňové úkoly bez potřeby neustálého zásahu člověka nebo přeformulování promptu.

Zvládání selhání a samokorekce

Agentic RAG autonomie zahrnuje také robustní mechanismy samokorekce. Když systém narazí na slepé uličky — například načtení irelevantních dokumentů nebo setkání s chybnými dotazy — může:

Tento iterativní a dynamický přístup umožňuje modelu se neustále zlepšovat, zajišťujíc, že není pouze jednorázovým systémem, ale systémem, který se učí ze svých chyb během dané relace.

Self Correction Mechanism

Hranice agenturnosti

Přestože je uvnitř úkolu autonomní, Agentic RAG není analogií Umělé obecné inteligence. Jeho „agentní“ schopnosti jsou omezeny na nástroje, datové zdroje a politiky poskytované lidskými vývojáři. Nemůže si vymýšlet vlastní nástroje ani vystoupit mimo nastavené hranice domény. Místo toho vyniká v dynamické orchestraci dostupných prostředků.
Klíčové rozdíly oproti pokročilejším formám AI zahrnují:

  1. Doménově specifická autonomie: Agentic RAG systémy se zaměřují na dosahování uživatelem definovaných cílů v dané známé doméně a používají strategie jako přepisování dotazů nebo výběr nástrojů ke zlepšení výsledků.
  2. Závislost na infrastruktuře: Schopnosti systému závisí na nástrojích a datech integrovaných vývojáři. Bez lidského zásahu nemůže tyto hranice překročit.
  3. Respektování zábran: Etické zásady, pravidla dodržování předpisů a obchodní politiky zůstávají velmi důležité. Svoboda agenta je vždy omezena bezpečnostními opatřeními a mechanismy dohledu (snad?).

Praktické případy použití a hodnota

Agentic RAG vyniká ve scénářích vyžadujících iterativní zpřesňování a přesnost:

  1. Prostředí kladoucí důraz na správnost: Při kontrolách shody, regulačních analýzách nebo právním výzkumu může agentní model opakovaně ověřovat fakta, konzultovat více zdrojů a přepisovat dotazy, dokud nevytvoří důkladně ověřenou odpověď.
  2. Složité interakce s databázemi: Při práci se strukturovanými daty, kde dotazy mohou často selhat nebo je třeba je upravit, může systém autonomně zpřesňovat své dotazy pomocí Azure SQL nebo Microsoft Fabric OneLake, aby konečné získávání odpovídalo záměru uživatele.
  3. Rozšířené pracovní postupy: Dlouhodobější relace se mohou vyvíjet, jak se objevují nové informace. Agentic RAG může neustále začleňovat nové údaje a měnit strategie podle toho, co se o problému doví.

Řízení, transparentnost a důvěra

Jak se tyto systémy stávají autonomnějšími ve svém uvažování, jsou řízení a transparentnost klíčové:

Mít nástroje, které poskytují jasný záznam akcí, je zásadní. Bez nich může být ladění vícestupňového procesu velmi obtížné. Viz následující příklad z Literal AI (společnost stojící za Chainlit) ukazující běh agenta:

AgentRunExample

Závěr

Agentic RAG představuje přirozený vývoj v tom, jak AI systémy řeší složité úkoly náročné na data. Přijetím vzorce smyčkové interakce, autonomním výběrem nástrojů a zpřesňováním dotazů až do dosažení vysoce kvalitního výsledku se systém posouvá nad rámec statického sledování výzev k adaptivnějšímu, kontextově uvědomělému rozhodovacímu mechanismu. Přestože je stále omezen lidsky definovanými infrastrukturami a etickými pokyny, tyto agentní schopnosti umožňují bohatší, dynamičtější a konečně užitečnější AI interakce pro podniky i koncové uživatele.

Máte další otázky ohledně Agentic RAG?

Připojte se k Microsoft Foundry Discord, setkejte se s dalšími studenty, navštěvujte konzultační hodiny a získejte odpovědi na vaše otázky ohledně AI Agentů.

Další zdroje

Akademické články

Předchozí lekce

Tool Use Design Pattern

Další lekce

Building Trustworthy AI Agents


Prohlášení o vyloučení odpovědnosti:
Tento dokument byl přeložen pomocí služby automatického překladu Co-op Translator. Přestože usilujeme o přesnost, mějte prosím na paměti, že automatické překlady mohou obsahovat chyby nebo nepřesnosti. Původní dokument v jeho mateřském jazyce by měl být považován za autoritativní zdroj. Pro důležité informace se doporučuje profesionální lidský překlad. Nepřejímáme odpovědnost za jakákoli nedorozumění nebo nesprávné výklady vzniklé použitím tohoto překladu.