ai-agents-for-beginners

Agentic RAG

(Klik op de afbeelding hierboven om de video van deze les te bekijken)

Agentic RAG

Deze les biedt een uitgebreid overzicht van Agentic Retrieval-Augmented Generation (Agentic RAG), een opkomend AI-paradigma waarbij grote taalmodellen (LLM’s) autonoom hun volgende stappen plannen terwijl ze informatie uit externe bronnen halen. In tegenstelling tot statische retrieval-then-read patronen omvat Agentic RAG iteratieve oproepen naar de LLM, afgewisseld met tool- of functie-aanroepen en gestructureerde outputs. Het systeem evalueert resultaten, verfijnt zoekopdrachten, roept indien nodig extra tools aan en zet deze cyclus voort totdat een bevredigende oplossing is bereikt.

Introductie

Deze les behandelt

Leerdoelen

Na het voltooien van deze les weet je hoe je/begrijp je:

Wat is Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) is een opkomend AI-paradigma waarbij grote taalmodellen (LLM’s) autonoom hun volgende stappen plannen terwijl ze informatie uit externe bronnen halen. In tegenstelling tot statische retrieval-then-read patronen omvat Agentic RAG iteratieve oproepen naar de LLM, afgewisseld met tool- of functie-aanroepen en gestructureerde outputs. Het systeem evalueert resultaten, verfijnt zoekopdrachten, roept indien nodig extra tools aan en zet deze cyclus voort totdat een bevredigende oplossing is bereikt. Deze iteratieve “maker-checker”-stijl verbetert de juistheid, behandelt malformed queries en zorgt voor hoogwaardige resultaten.

Het systeem beheert actief zijn redeneringsproces, herschrijft mislukte zoekopdrachten, kiest verschillende retrieval-methoden en integreert meerdere tools — zoals vectoraanzoeken in Azure AI Search, SQL-databases, of aangepaste API’s — voordat het antwoord wordt afgerond. De onderscheidende eigenschap van een agentic systeem is zijn vermogen om zijn redeneringsproces te bezitten. Traditionele RAG-implementaties vertrouwen op vooraf gedefinieerde paden, maar een agentic systeem bepaalt autonoom de volgorde van stappen op basis van de kwaliteit van de gevonden informatie.

Het definiëren van Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) is een opkomend paradigma in AI-ontwikkeling waarbij LLM’s niet alleen informatie uit externe gegevensbronnen halen, maar ook autonoom hun volgende stappen plannen. In tegenstelling tot statische retrieval-then-read patronen of zorgvuldig gescripte promptsequenties, omvat Agentic RAG een lus van iteratieve oproepen naar de LLM, afgewisseld met tool- of functie-aanroepen en gestructureerde outputs. Bij elke stap evalueert het systeem de verkregen resultaten, beslist of het zijn zoekopdrachten moet verfijnen, roept extra tools aan indien nodig en zet dit proces voort totdat een bevredigende oplossing is bereikt.

Deze iteratieve “maker-checker”-stijl is ontworpen om juistheid te verbeteren, malformed queries naar gestructureerde databases (bijv. NL2SQL) te verwerken en gebalanceerde, hoogwaardige resultaten te garanderen. In plaats van uitsluitend te vertrouwen op zorgvuldig ontworpen promptketens, beheert het systeem actief zijn redeneringsproces. Het kan zoekopdrachten herschrijven die mislukken, verschillende retrieval-methodes kiezen, en meerdere tools integreren — zoals vectoraanzoeken in Azure AI Search, SQL-databases of aangepaste API’s — voordat het antwoord wordt afgerond. Dit maakt het gebruik van overmatig complexe orkestratiekaders overbodig. In plaats daarvan kan een relatief eenvoudige lus van “LLM-oproep → toolgebruik → LLM-oproep → …” geavanceerde en goed onderbouwde outputs opleveren.

Agentic RAG Core Loop

Het Redeneringsproces Bezitten

De onderscheidende kwaliteit die een systeem “agentic” maakt, is het vermogen om zijn redeneringsproces te bezitten. Traditionele RAG-implementaties zijn vaak afhankelijk van mensen die een pad voor het model vooraf definiëren: een chain-of-thought die beschrijft wat opgehaald moet worden en wanneer. Maar wanneer een systeem echt agentic is, beslist het intern hoe het het probleem benadert. Het volgt niet slechts een script; het bepaalt autonoom de volgorde van stappen op basis van de kwaliteit van de gevonden informatie. Bijvoorbeeld, als het wordt gevraagd een productlanceringsstrategie op te stellen, vertrouwt het niet alleen op een prompt die de hele onderzoeks- en besluitvormingsworkflow uitspelt. In plaats daarvan beslist het agentic model zelfstandig om:

  1. Recente markttrendrapporten op te halen met Bing Web Grounding
  2. Relevante concurrentgegevens te identificeren met Azure AI Search.
  3. Historische interne verkoopstatistieken te correleren met Azure SQL Database.
  4. De bevindingen samen te vatten in een samenhangende strategie gecoördineerd via Azure OpenAI Service.
  5. De strategie te evalueren op hiaten of inconsistenties, en indien nodig een nieuwe ronde van informatie-ophaling te starten. Al deze stappen — het verfijnen van zoekopdrachten, het kiezen van bronnen, itereren totdat het “tevreden” is met het antwoord — worden door het model besloten, niet vooraf door een mens gescripte.

Iteratieve Lussen, Toolintegratie en Geheugen

Tool Integration Architecture

Een agentic systeem vertrouwt op een gelust interactiepatroon:

In de loop van de tijd creëert dit een gevoel van evoluerend begrip, waarmee het model complexe, meerstaps taken kan navigeren zonder dat een mens constant hoeft in te grijpen of de prompt hoeft te herschikken.

Omgaan met Faalmodi en Zelfcorrectie

De autonomie van Agentic RAG omvat ook robuuste zelfcorrectiemechanismen. Wanneer het systeem vastloopt — bijvoorbeeld door het ophalen van irrelevante documenten of het tegenkomen van malformed queries — kan het:

Deze iteratieve en dynamische aanpak maakt het mogelijk dat het model continu verbetert, zodat het niet slechts een eenmalig systeem is, maar een dat leert van zijn fouten binnen een sessie.

Self Correction Mechanism

Grenzen van Agentie

Ondanks zijn autonomie binnen een taak is Agentic RAG niet vergelijkbaar met Artificial General Intelligence. Zijn “agentic” capaciteiten zijn beperkt tot de tools, datapunten en beleidslijnen die door menselijke ontwikkelaars worden geleverd. Het kan zijn eigen tools niet uitvinden of buiten de domeingrenzen treden die zijn gesteld. In plaats daarvan blinkt het uit in het dynamisch orkestreren van de beschikbare middelen. Belangrijke verschillen met meer geavanceerde AI-vormen zijn:

  1. Domeinspecifieke Autonomie: Agentic RAG-systemen richten zich op het behalen van door gebruikers gedefinieerde doelen binnen een bekend domein, waarbij strategieën als herschrijven van zoekopdrachten of toolselectie worden gebruikt om resultaten te verbeteren.
  2. Infrastructuur-afhankelijk: De capaciteiten van het systeem zijn afhankelijk van de tools en data die door ontwikkelaars zijn geïntegreerd. Het kan deze grenzen niet overschrijden zonder menselijke tussenkomst.
  3. Respect voor Richtlijnen: Ethische richtlijnen, compliance-regels en bedrijfsbeleid blijven zeer belangrijk. De vrijheid van de agent is altijd beperkt door veiligheidsmaatregelen en toezichtmechanismen (hopelijk?).

Praktische Toepassingen en Waarde

Agentic RAG blinkt uit in scenario’s die iteratieve verfijning en precisie vereisen:

  1. Omgevingen Waar Juistheid Vooropstaat: Bij compliance-controles, regelgevingsanalyses of juridisch onderzoek kan het agentic model feiten herhaaldelijk verifiëren, meerdere bronnen raadplegen en zoekopdrachten herschrijven totdat het een grondig gecontroleerd antwoord geeft.
  2. Complexe Database-Interactie: Bij gestructureerde data waar zoekopdrachten vaak falen of aanpassing behoeven, kan het systeem autonoom zijn zoekopdrachten verfijnen met Azure SQL of Microsoft Fabric OneLake, en zo zorgen dat het eindresultaat aansluit bij de intentie van de gebruiker.
  3. Uitgebreide Workflows: Langere sessies kunnen evolueren naarmate nieuwe informatie beschikbaar komt. Agentic RAG kan continu nieuwe data opnemen en strategieën aanpassen naarmate het meer leert over het probleemgebied.

Bestuur, Transparantie en Vertrouwen

Naarmate deze systemen autonomer worden in hun redenering, zijn bestuur en transparantie cruciaal:

Het hebben van tools die een duidelijke registratie van acties bieden is essentieel. Zonder deze is het debuggen van een meerstapsproces erg lastig. Zie het volgende voorbeeld van Literal AI (bedrijf achter Chainlit) voor een Agent-run:

AgentRunExample

Conclusie

Agentic RAG vertegenwoordigt een natuurlijke evolutie in hoe AI-systemen omgaan met complexe, data-intensieve taken. Door een gelust interactiepatroon te adopteren, autonoom tools te selecteren en zoekopdrachten te verfijnen tot een hoogwaardig resultaat is bereikt, gaat het systeem verder dan statisch promptvolgen naar een adaptievere, contextbewuste besluitvormer. Hoewel het nog steeds beperkt is door door mensen gedefinieerde infrastructuren en ethische richtlijnen, maken deze agentic capaciteiten rijkere, dynamischere en uiteindelijk nuttigere AI-interacties mogelijk voor zowel bedrijven als eindgebruikers.

Nog meer vragen over Agentic RAG?

Word lid van de Microsoft Foundry Discord om andere studenten te ontmoeten, kantoortuinen bij te wonen en je AI Agents-vragen beantwoord te krijgen.

Aanvullende bronnen

Wetenschappelijke Artikelen

Vorige Les

Tool Use Design Pattern

Volgende Les

Betrouwbare AI-agenten bouwen


Disclaimer: Dit document is vertaald met behulp van de AI-vertalingsdienst Co-op Translator. Hoewel we streven naar nauwkeurigheid, verzoeken wij u ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onjuistheden kunnen bevatten. Het originele document in de oorspronkelijke taal dient als de gezaghebbende bron te worden beschouwd. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerd uitgelegde informatie die voortkomen uit het gebruik van deze vertaling.