ai-agents-for-beginners

Agentic RAG

(Klik op de afbeelding hierboven om de video van deze les te bekijken)

Agentic RAG

Deze les biedt een uitgebreide introductie tot Agentic Retrieval-Augmented Generation (Agentic RAG), een opkomend AI-paradigma waarbij grote taalmodellen (LLMs) autonoom hun volgende stappen plannen terwijl ze informatie ophalen uit externe bronnen. In tegenstelling tot statische patronen van ophalen en lezen, omvat Agentic RAG iteratieve oproepen naar het LLM, afgewisseld met tool- of functieoproepen en gestructureerde outputs. Het systeem evalueert resultaten, verfijnt zoekopdrachten, roept indien nodig extra tools aan en herhaalt deze cyclus totdat een bevredigende oplossing is bereikt.

Introductie

Deze les behandelt:

Leerdoelen

Na het voltooien van deze les weet je hoe je:

Wat is Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) is een opkomend AI-paradigma waarbij grote taalmodellen (LLMs) autonoom hun volgende stappen plannen terwijl ze informatie ophalen uit externe bronnen. In tegenstelling tot statische patronen van ophalen en lezen, omvat Agentic RAG iteratieve oproepen naar het LLM, afgewisseld met tool- of functieoproepen en gestructureerde outputs. Het systeem evalueert resultaten, verfijnt zoekopdrachten, roept indien nodig extra tools aan en herhaalt deze cyclus totdat een bevredigende oplossing is bereikt. Deze iteratieve “maker-checker” stijl verbetert de nauwkeurigheid, corrigeert foutieve zoekopdrachten en zorgt voor hoogwaardige resultaten.

Het systeem beheert actief zijn redeneerproces, herschrijft mislukte zoekopdrachten, kiest verschillende ophaalmethoden en integreert meerdere tools—zoals vectorzoekopdrachten in Azure AI Search, SQL-databases of aangepaste API’s—voordat het zijn antwoord afrondt. De onderscheidende eigenschap van een agentisch systeem is het vermogen om zijn eigen redeneerproces te beheren. Traditionele RAG-implementaties vertrouwen op vooraf gedefinieerde paden, maar een agentisch systeem bepaalt autonoom de volgorde van stappen op basis van de kwaliteit van de gevonden informatie.

Definitie van Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) is een opkomend paradigma in AI-ontwikkeling waarbij LLMs niet alleen informatie ophalen uit externe databronnen, maar ook autonoom hun volgende stappen plannen. In tegenstelling tot statische patronen van ophalen en lezen of zorgvuldig gescripte promptreeksen, omvat Agentic RAG een cyclus van iteratieve oproepen naar het LLM, afgewisseld met tool- of functieoproepen en gestructureerde outputs. Bij elke stap evalueert het systeem de verkregen resultaten, beslist of het zoekopdrachten moet verfijnen, roept indien nodig extra tools aan en herhaalt deze cyclus totdat een bevredigende oplossing is bereikt.

Deze iteratieve “maker-checker” stijl van werken is ontworpen om de nauwkeurigheid te verbeteren, foutieve zoekopdrachten naar gestructureerde databases (bijv. NL2SQL) te corrigeren en gebalanceerde, hoogwaardige resultaten te garanderen. In plaats van uitsluitend te vertrouwen op zorgvuldig ontworpen promptketens, beheert het systeem actief zijn redeneerproces. Het kan zoekopdrachten herschrijven die mislukken, verschillende ophaalmethoden kiezen en meerdere tools integreren—zoals vectorzoekopdrachten in Azure AI Search, SQL-databases of aangepaste API’s—voordat het zijn antwoord afrondt. Dit elimineert de noodzaak voor overdreven complexe orkestratiekaders. In plaats daarvan kan een relatief eenvoudige cyclus van “LLM-oproep → toolgebruik → LLM-oproep → …” leiden tot verfijnde en goed onderbouwde outputs.

Agentic RAG Core Loop

Het redeneerproces beheren

De onderscheidende eigenschap die een systeem “agentisch” maakt, is het vermogen om zijn redeneerproces te beheren. Traditionele RAG-implementaties vertrouwen vaak op mensen om een pad voor het model vooraf te definiëren: een chain-of-thought die aangeeft wat te halen en wanneer. Maar wanneer een systeem echt agentisch is, beslist het intern hoe het probleem moet worden aangepakt. Het voert niet alleen een script uit; het bepaalt autonoom de volgorde van stappen op basis van de kwaliteit van de gevonden informatie.

Bijvoorbeeld, als het wordt gevraagd om een strategie voor een productlancering te creëren, vertrouwt het niet alleen op een prompt die de hele onderzoeks- en besluitvormingsworkflow beschrijft. In plaats daarvan besluit het agentische model zelfstandig om:

  1. Actuele markttrendrapporten op te halen via Bing Web Grounding.
  2. Relevante concurrentiedata te identificeren via Azure AI Search.
  3. Historische interne verkoopstatistieken te correleren via Azure SQL Database.
  4. De bevindingen te synthetiseren tot een samenhangende strategie, georkestreerd via Azure OpenAI Service.
  5. De strategie te evalueren op hiaten of inconsistenties, wat kan leiden tot een nieuwe ronde van ophalen indien nodig.

Al deze stappen—zoekopdrachten verfijnen, bronnen kiezen, itereren totdat het “tevreden” is met het antwoord—worden door het model zelf beslist, niet vooraf gescript door een mens.

Iteratieve loops, toolintegratie en geheugen

Tool Integration Architecture

Een agentisch systeem vertrouwt op een interactiepatroon met loops:

Na verloop van tijd creëert dit een gevoel van evoluerend begrip, waardoor het model complexe, meerstaps taken kan navigeren zonder dat een mens constant hoeft in te grijpen of de prompt opnieuw moet vormgeven.

Omgaan met faalmodi en zelfcorrectie

De autonomie van Agentic RAG omvat ook robuuste zelfcorrectiemechanismen. Wanneer het systeem op doodlopende wegen stuit—zoals het ophalen van irrelevante documenten of het tegenkomen van foutieve zoekopdrachten—kan het:

Deze iteratieve en dynamische aanpak stelt het model in staat om continu te verbeteren, waardoor het niet slechts een eenmalig systeem is, maar een systeem dat leert van zijn misstappen tijdens een sessie.

Self Correction Mechanism

Grenzen van autonomie

Ondanks zijn autonomie binnen een taak, is Agentic RAG niet vergelijkbaar met Kunstmatige Algemene Intelligentie. Zijn “agentische” capaciteiten zijn beperkt tot de tools, databronnen en beleidsregels die door menselijke ontwikkelaars worden geleverd. Het kan geen eigen tools uitvinden of buiten de domeingrenzen treden die zijn ingesteld. In plaats daarvan blinkt het uit in het dynamisch orkestreren van de beschikbare middelen.

Belangrijke verschillen met meer geavanceerde AI-vormen zijn:

  1. Domeinspecifieke autonomie: Agentic RAG-systemen zijn gericht op het bereiken van door de gebruiker gedefinieerde doelen binnen een bekend domein, waarbij strategieën zoals zoekopdrachten herschrijven of toolselectie worden gebruikt om de resultaten te verbeteren.
  2. Afhankelijk van infrastructuur: De capaciteiten van het systeem hangen af van de tools en data die door ontwikkelaars zijn geïntegreerd. Het kan deze grenzen niet overschrijden zonder menselijke tussenkomst.
  3. Respect voor veiligheidsmaatregelen: Ethische richtlijnen, nalevingsregels en bedrijfsbeleid blijven erg belangrijk. De vrijheid van de agent is altijd beperkt door veiligheidsmaatregelen en controlemechanismen (hopelijk?).

Praktische toepassingen en waarde

Agentic RAG blinkt uit in scenario’s die iteratieve verfijning en precisie vereisen:

  1. Omgevingen waar nauwkeurigheid voorop staat: Bij nalevingscontroles, regelgevingsanalyses of juridisch onderzoek kan het agentische model feiten herhaaldelijk verifiëren, meerdere bronnen raadplegen en zoekopdrachten herschrijven totdat het een grondig gecontroleerd antwoord produceert.
  2. Complexe database-interacties: Bij gestructureerde data waar zoekopdrachten vaak kunnen mislukken of moeten worden aangepast, kan het systeem zelfstandig zijn zoekopdrachten verfijnen met Azure SQL of Microsoft Fabric OneLake, zodat de uiteindelijke resultaten aansluiten bij de intentie van de gebruiker.
  3. Uitgebreide workflows: Langdurige sessies kunnen evolueren naarmate nieuwe informatie beschikbaar komt. Agentic RAG kan continu nieuwe data integreren en strategieën aanpassen naarmate het meer leert over het probleemgebied.

Governance, transparantie en vertrouwen

Naarmate deze systemen autonomer worden in hun redeneerprocessen, zijn governance en transparantie cruciaal:

Het hebben van tools die een duidelijk overzicht van acties bieden is essentieel. Zonder deze tools kan het debuggen van een meerstapsproces erg moeilijk zijn. Zie het volgende voorbeeld van Literal AI (bedrijf achter Chainlit) voor een Agent-run:

AgentRunExample

AgentRunExample2

Conclusie

Agentic RAG vertegenwoordigt een natuurlijke evolutie in hoe AI-systemen complexe, data-intensieve taken aanpakken. Door een interactiepatroon met loops te adopteren, autonoom tools te selecteren en zoekopdrachten te verfijnen totdat een hoogwaardig resultaat is bereikt, gaat het systeem verder dan statisch prompt-volgen naar een meer adaptieve, contextbewuste besluitvormer. Hoewel het nog steeds beperkt is door menselijk gedefinieerde infrastructuren en ethische richtlijnen, maken deze agentische capaciteiten rijkere, dynamischere en uiteindelijk nuttigere AI-interacties mogelijk voor zowel bedrijven als eindgebruikers.

Meer vragen over Agentic RAG?

Word lid van de Azure AI Foundry Discord om andere leerlingen te ontmoeten, kantooruren bij te wonen en je vragen over AI Agents beantwoord te krijgen.

Aanvullende bronnen

- Implementeer Retrieval Augmented Generation (RAG) met Azure OpenAI Service: Leer hoe je je eigen data kunt gebruiken met de Azure OpenAI Service. Deze Microsoft Learn-module biedt een uitgebreide gids voor het implementeren van RAG

Academische Artikelen

Vorige Les

Tool Use Design Pattern

Volgende Les

Vertrouwenswaardige AI-agents bouwen


Disclaimer:
Dit document is vertaald met behulp van de AI-vertalingsservice Co-op Translator. Hoewel we ons best doen voor nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in zijn oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.