ai-agents-for-beginners

Agentic RAG

(Klik op de afbeelding hierboven om de video van deze les te bekijken)

Agentic RAG

Deze les biedt een uitgebreide introductie tot Agentic Retrieval-Augmented Generation (Agentic RAG), een opkomend AI-paradigma waarbij grote taalmodellen (LLMs) zelfstandig hun volgende stappen plannen terwijl ze informatie ophalen uit externe bronnen. In tegenstelling tot statische patronen van ophalen en lezen, omvat Agentic RAG iteratieve oproepen naar het LLM, afgewisseld met tool- of functieoproepen en gestructureerde outputs. Het systeem evalueert resultaten, verfijnt zoekopdrachten, roept indien nodig extra tools aan en herhaalt deze cyclus totdat een bevredigende oplossing is bereikt.

Introductie

Deze les behandelt:

Leerdoelen

Na het voltooien van deze les weet je hoe je:

Wat is Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) is een opkomend AI-paradigma waarbij grote taalmodellen (LLMs) zelfstandig hun volgende stappen plannen terwijl ze informatie ophalen uit externe bronnen. In tegenstelling tot statische patronen van ophalen en lezen, omvat Agentic RAG iteratieve oproepen naar het LLM, afgewisseld met tool- of functieoproepen en gestructureerde outputs. Het systeem evalueert resultaten, verfijnt zoekopdrachten, roept indien nodig extra tools aan en herhaalt deze cyclus totdat een bevredigende oplossing is bereikt. Deze iteratieve “maker-checker” stijl verbetert de nauwkeurigheid, corrigeert foutieve zoekopdrachten en zorgt voor hoogwaardige resultaten.

Het systeem beheert actief zijn eigen redeneringsproces, herschrijft mislukte zoekopdrachten, kiest verschillende ophaalmethoden en integreert meerdere tools—zoals vectorzoekopdrachten in Azure AI Search, SQL-databases of aangepaste API’s—voordat het zijn antwoord afrondt. De onderscheidende eigenschap van een agentisch systeem is het vermogen om zijn eigen redeneringsproces te beheren. Traditionele RAG-implementaties vertrouwen op vooraf gedefinieerde paden, maar een agentisch systeem bepaalt autonoom de volgorde van stappen op basis van de kwaliteit van de gevonden informatie.

Definitie van Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) is een opkomend paradigma in AI-ontwikkeling waarbij LLMs niet alleen informatie ophalen uit externe databronnen, maar ook zelfstandig hun volgende stappen plannen. In tegenstelling tot statische patronen van ophalen en lezen of zorgvuldig gescripte promptreeksen, omvat Agentic RAG een cyclus van iteratieve oproepen naar het LLM, afgewisseld met tool- of functieoproepen en gestructureerde outputs. Bij elke stap evalueert het systeem de verkregen resultaten, beslist of het zoekopdrachten moet verfijnen, roept indien nodig extra tools aan en herhaalt deze cyclus totdat een bevredigende oplossing is bereikt.

Deze iteratieve “maker-checker” stijl van werken is ontworpen om de nauwkeurigheid te verbeteren, foutieve zoekopdrachten naar gestructureerde databases (bijv. NL2SQL) te corrigeren en gebalanceerde, hoogwaardige resultaten te garanderen. In plaats van uitsluitend te vertrouwen op zorgvuldig ontworpen promptketens, beheert het systeem actief zijn eigen redeneringsproces. Het kan zoekopdrachten herschrijven die mislukken, verschillende ophaalmethoden kiezen en meerdere tools integreren—zoals vectorzoekopdrachten in Azure AI Search, SQL-databases of aangepaste API’s—voordat het zijn antwoord afrondt. Dit elimineert de noodzaak voor overdreven complexe orkestratiekaders. In plaats daarvan kan een relatief eenvoudige cyclus van “LLM-oproep → toolgebruik → LLM-oproep → …” leiden tot verfijnde en goed onderbouwde outputs.

Agentic RAG Core Loop

Het Redeneringsproces Beheren

De onderscheidende eigenschap die een systeem “agentisch” maakt, is het vermogen om zijn eigen redeneringsproces te beheren. Traditionele RAG-implementaties vertrouwen vaak op mensen om een pad voor het model vooraf te definiëren: een chain-of-thought die aangeeft wat te halen en wanneer. Maar wanneer een systeem echt agentisch is, beslist het intern hoe het probleem moet worden aangepakt. Het voert niet alleen een script uit; het bepaalt autonoom de volgorde van stappen op basis van de kwaliteit van de gevonden informatie.

Bijvoorbeeld, als het wordt gevraagd om een strategie voor een productlancering te creëren, vertrouwt het niet alleen op een prompt die de hele onderzoeks- en besluitvormingsworkflow beschrijft. In plaats daarvan besluit het agentische model zelfstandig om:

  1. Actuele markttrendrapporten op te halen via Bing Web Grounding.
  2. Relevante concurrentiedata te identificeren met Azure AI Search.
  3. Historische interne verkoopstatistieken te correleren via Azure SQL Database.
  4. De bevindingen te synthetiseren tot een samenhangende strategie, georkestreerd via Azure OpenAI Service.
  5. De strategie te evalueren op hiaten of inconsistenties, wat kan leiden tot een nieuwe ronde van ophalen indien nodig.

Al deze stappen—zoekopdrachten verfijnen, bronnen kiezen, itereren totdat het “tevreden” is met het antwoord—worden door het model zelf beslist, niet vooraf gescript door een mens.

Iteratieve Cycli, Toolintegratie en Geheugen

Tool Integration Architecture

Een agentisch systeem vertrouwt op een interactiepatroon met cycli:

Na verloop van tijd creëert dit een gevoel van evoluerend begrip, waardoor het model complexe, meerstaps taken kan uitvoeren zonder dat een mens constant hoeft in te grijpen of de prompt opnieuw moet vormgeven.

Omgaan met Faalmodi en Zelfcorrectie

De autonomie van Agentic RAG omvat ook robuuste zelfcorrectiemechanismen. Wanneer het systeem op doodlopende wegen stuit—zoals het ophalen van irrelevante documenten of het tegenkomen van foutieve zoekopdrachten—kan het:

Deze iteratieve en dynamische aanpak stelt het model in staat om continu te verbeteren, waardoor het niet slechts een eenmalig systeem is, maar een systeem dat leert van zijn fouten tijdens een sessie.

Zelfcorrectiemechanisme

Grenzen van Autonomie

Ondanks zijn autonomie binnen een taak is Agentic RAG niet vergelijkbaar met Artificial General Intelligence. Zijn “agentische” capaciteiten zijn beperkt tot de tools, databronnen en beleidsregels die door menselijke ontwikkelaars worden geleverd. Het kan geen eigen tools uitvinden of buiten de domeingrenzen treden die zijn ingesteld. In plaats daarvan blinkt het uit in het dynamisch orkestreren van de beschikbare middelen.

Belangrijke verschillen met meer geavanceerde AI-vormen zijn:

  1. Domeinspecifieke Autonomie: Agentic RAG-systemen zijn gericht op het bereiken van door de gebruiker gedefinieerde doelen binnen een bekend domein, waarbij strategieën zoals zoekopdrachten herschrijven of toolselectie worden gebruikt om resultaten te verbeteren.
  2. Afhankelijk van Infrastructuur: De capaciteiten van het systeem hangen af van de tools en data die door ontwikkelaars zijn geïntegreerd. Het kan deze grenzen niet overschrijden zonder menselijke tussenkomst.
  3. Respect voor Veiligheidsmaatregelen: Ethische richtlijnen, nalevingsregels en bedrijfsbeleid blijven erg belangrijk. De vrijheid van de agent wordt altijd beperkt door veiligheidsmaatregelen en controlemechanismen (hopelijk?).

Praktische Toepassingen en Waarde

Agentic RAG blinkt uit in scenario’s die iteratieve verfijning en precisie vereisen:

  1. Omgevingen Waar Nauwkeurigheid Voorop Staat: Bij nalevingscontroles, regelgevingsanalyses of juridisch onderzoek kan het agentische model feiten herhaaldelijk verifiëren, meerdere bronnen raadplegen en zoekopdrachten herschrijven totdat het een grondig gecontroleerd antwoord produceert.
  2. Complexe Database-Interacties: Bij gestructureerde data waar zoekopdrachten vaak kunnen mislukken of moeten worden aangepast, kan het systeem zelfstandig zoekopdrachten verfijnen met Azure SQL of Microsoft Fabric OneLake, zodat de uiteindelijke resultaten aansluiten bij de intentie van de gebruiker.
  3. Uitgebreide Workflows: Langdurige sessies kunnen evolueren naarmate nieuwe informatie beschikbaar komt. Agentic RAG kan continu nieuwe data opnemen en strategieën aanpassen naarmate het meer leert over de probleemruimte.

Governance, Transparantie en Vertrouwen

Naarmate deze systemen autonomer worden in hun redenering, zijn governance en transparantie cruciaal:

Het hebben van tools die een duidelijk overzicht van acties bieden is essentieel. Zonder deze tools kan het debuggen van een meerstapsproces erg moeilijk zijn. Zie het volgende voorbeeld van Literal AI (bedrijf achter Chainlit) voor een Agent-run:

AgentRunExample

Conclusie

Agentic RAG vertegenwoordigt een natuurlijke evolutie in hoe AI-systemen complexe, data-intensieve taken aanpakken. Door een interactiepatroon met cycli te adopteren, tools autonoom te selecteren en zoekopdrachten te verfijnen totdat een hoogwaardig resultaat is bereikt, beweegt het systeem voorbij statisch prompt-volgen naar een meer adaptieve, contextbewuste besluitvormer. Hoewel het nog steeds beperkt is door menselijk gedefinieerde infrastructuren en ethische richtlijnen, maken deze agentische capaciteiten rijkere, dynamischere en uiteindelijk nuttigere AI-interacties mogelijk voor zowel bedrijven als eindgebruikers.

Meer Vragen over Agentic RAG?

Word lid van de Azure AI Foundry Discord om andere leerlingen te ontmoeten, kantooruren bij te wonen en je vragen over AI Agents beantwoord te krijgen.

Aanvullende Bronnen

Academische artikelen

Vorige les

Toolgebruik ontwerp patroon

Volgende les

Vertrouwen opbouwen in AI-agenten


Disclaimer:
Dit document is vertaald met behulp van de AI-vertalingsservice Co-op Translator. Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor eventuele misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.