
(Klik på billedet ovenfor for at se videoen til denne lektion)
Agentic RAG
Denne lektion giver en omfattende introduktion til Agentic Retrieval-Augmented Generation (Agentic RAG), et nyt AI-paradigme, hvor store sprogmodeller (LLMs) selvstændigt planlægger deres næste skridt, mens de henter information fra eksterne kilder. I modsætning til statiske retrieval-then-read-mønstre involverer Agentic RAG iterative opkald til LLM’en, afbrudt af værktøjs- eller funktionskald og strukturerede outputs. Systemet evaluerer resultater, forfiner forespørgsler, anvender yderligere værktøjer, hvis nødvendigt, og fortsætter denne cyklus, indtil en tilfredsstillende løsning er opnået.
Introduktion
Denne lektion vil dække:
- Forstå Agentic RAG: Lær om det nye paradigme inden for AI, hvor store sprogmodeller (LLMs) selvstændigt planlægger deres næste skridt, mens de henter information fra eksterne datakilder.
- Forstå Iterativ Maker-Checker Stil: Forstå loopet af iterative opkald til LLM’en, afbrudt af værktøjs- eller funktionskald og strukturerede outputs, designet til at forbedre korrekthed og håndtere fejlbehæftede forespørgsler.
- Udforsk Praktiske Anvendelser: Identificer scenarier, hvor Agentic RAG udmærker sig, såsom korrekthedsorienterede miljøer, komplekse databaseinteraktioner og udvidede arbejdsgange.
Læringsmål
Efter at have gennemført denne lektion vil du vide, hvordan du/forstå:
- Forståelse af Agentic RAG: Lær om det nye paradigme inden for AI, hvor store sprogmodeller (LLMs) selvstændigt planlægger deres næste skridt, mens de henter information fra eksterne datakilder.
- Iterativ Maker-Checker Stil: Forstå konceptet med et loop af iterative opkald til LLM’en, afbrudt af værktøjs- eller funktionskald og strukturerede outputs, designet til at forbedre korrekthed og håndtere fejlbehæftede forespørgsler.
- Eje Beslutningsprocessen: Forstå systemets evne til at eje sin beslutningsproces og træffe beslutninger om, hvordan problemer skal tackles uden at være afhængig af foruddefinerede veje.
- Arbejdsgang: Forstå, hvordan en agentisk model selvstændigt beslutter at hente markedsrapporter, identificere konkurrentdata, korrelere interne salgsdata, syntetisere resultater og evaluere strategien.
- Iterative Loops, Værktøjsintegration og Hukommelse: Lær om systemets afhængighed af et loop-interaktionsmønster, der opretholder tilstand og hukommelse på tværs af trin for at undgå gentagelser og træffe informerede beslutninger.
- Håndtering af Fejltilstande og Selvkorrektion: Udforsk systemets robuste selvkorrigeringsmekanismer, herunder iteration og genforespørgsel, brug af diagnostiske værktøjer og tilbagefald til menneskelig overvågning.
- Grænser for Agentic RAG: Forstå begrænsningerne ved Agentic RAG med fokus på domænespecifik autonomi, afhængighed af infrastruktur og respekt for sikkerhedsforanstaltninger.
- Praktiske Anvendelser og Værdi: Identificer scenarier, hvor Agentic RAG udmærker sig, såsom korrekthedsorienterede miljøer, komplekse databaseinteraktioner og udvidede arbejdsgange.
- Styring, Gennemsigtighed og Tillid: Lær om vigtigheden af styring og gennemsigtighed, herunder forklarlig beslutningstagning, kontrol af bias og menneskelig overvågning.
Hvad er Agentic RAG?
Agentic Retrieval-Augmented Generation (Agentic RAG) er et nyt AI-paradigme, hvor store sprogmodeller (LLMs) selvstændigt planlægger deres næste skridt, mens de henter information fra eksterne kilder. I modsætning til statiske retrieval-then-read-mønstre involverer Agentic RAG iterative opkald til LLM’en, afbrudt af værktøjs- eller funktionskald og strukturerede outputs. Systemet evaluerer resultater, forfiner forespørgsler, anvender yderligere værktøjer, hvis nødvendigt, og fortsætter denne cyklus, indtil en tilfredsstillende løsning er opnået. Denne iterative “maker-checker”-stil forbedrer korrekthed, håndterer fejlbehæftede forespørgsler og sikrer resultater af høj kvalitet.
Systemet tager aktivt ejerskab over sin beslutningsproces, omskriver fejlede forespørgsler, vælger forskellige metoder til informationshentning og integrerer flere værktøjer—såsom vektorsøgning i Azure AI Search, SQL-databaser eller brugerdefinerede API’er—før det færdiggør sit svar. Den afgørende kvalitet ved et agentisk system er dets evne til at eje sin beslutningsproces. Traditionelle RAG-implementeringer er afhængige af foruddefinerede veje, men et agentisk system bestemmer selv rækkefølgen af trin baseret på kvaliteten af den information, det finder.
Definition af Agentic Retrieval-Augmented Generation (Agentic RAG)
Agentic Retrieval-Augmented Generation (Agentic RAG) er et nyt paradigme inden for AI-udvikling, hvor LLM’er ikke kun henter information fra eksterne datakilder, men også selvstændigt planlægger deres næste skridt. I modsætning til statiske retrieval-then-read-mønstre eller nøje scriptede promptsekvenser involverer Agentic RAG et loop af iterative opkald til LLM’en, afbrudt af værktøjs- eller funktionskald og strukturerede outputs. Ved hver iteration evaluerer systemet de opnåede resultater, beslutter, om forespørgsler skal forfines, anvender yderligere værktøjer, hvis nødvendigt, og fortsætter denne cyklus, indtil en tilfredsstillende løsning er opnået.
Denne iterative “maker-checker”-stil er designet til at forbedre korrekthed, håndtere fejlbehæftede forespørgsler til strukturerede databaser (f.eks. NL2SQL) og sikre balancerede, høj-kvalitets resultater. I stedet for kun at stole på nøje udformede promptkæder tager systemet aktivt ejerskab over sin beslutningsproces. Det kan omskrive fejlede forespørgsler, vælge forskellige metoder til informationshentning og integrere flere værktøjer—såsom vektorsøgning i Azure AI Search, SQL-databaser eller brugerdefinerede API’er—før det færdiggør sit svar. Dette eliminerer behovet for overdrevent komplekse orkestreringsrammer. I stedet kan en relativt simpel loop af “LLM-opkald → værktøjsbrug → LLM-opkald → …” resultere i sofistikerede og velbegrundede outputs.

Ejerskab af Beslutningsprocessen
Den afgørende kvalitet, der gør et system “agentisk,” er dets evne til at eje sin beslutningsproces. Traditionelle RAG-implementeringer er ofte afhængige af, at mennesker foruddefinerer en sti for modellen: en ræsonnementskæde, der beskriver, hvad der skal hentes, og hvornår.
Men når et system er virkelig agentisk, beslutter det internt, hvordan det skal gribe problemet an. Det udfører ikke bare et script; det bestemmer selv rækkefølgen af trin baseret på kvaliteten af den information, det finder.
For eksempel, hvis det bliver bedt om at udarbejde en produktlanceringsstrategi, er det ikke kun afhængigt af en prompt, der beskriver hele forsknings- og beslutningsarbejdsgangen. I stedet beslutter den agentiske model selvstændigt at:
- Hente aktuelle markedsrapporter ved hjælp af Bing Web Grounding.
- Identificere relevante konkurrentdata ved hjælp af Azure AI Search.
- Korrelere historiske interne salgsdata ved hjælp af Azure SQL Database.
- Syntetisere resultaterne til en sammenhængende strategi orkestreret via Azure OpenAI Service.
- Evaluere strategien for mangler eller inkonsistenser og igangsætte en ny runde af informationshentning, hvis nødvendigt.
Alle disse trin—at forfine forespørgsler, vælge kilder, iterere, indtil svaret er tilfredsstillende—besluttes af modellen og er ikke foruddefineret af et menneske.
Iterative Loops, Værktøjsintegration og Hukommelse

Et agentisk system er afhængigt af et loop-interaktionsmønster:
- Første Opkald: Brugerens mål (dvs. brugerens prompt) præsenteres for LLM’en.
- Værktøjsanvendelse: Hvis modellen identificerer manglende information eller uklare instruktioner, vælger den et værktøj eller en metode til informationshentning—som en vektordatabaseforespørgsel (f.eks. Azure AI Search Hybrid-søgning over private data) eller et struktureret SQL-opkald—for at indsamle mere kontekst.
- Vurdering og Forfining: Efter at have gennemgået de returnerede data beslutter modellen, om informationen er tilstrækkelig. Hvis ikke, forfiner den forespørgslen, prøver et andet værktøj eller justerer sin tilgang.
- Gentag Indtil Tilfreds: Denne cyklus fortsætter, indtil modellen vurderer, at den har tilstrækkelig klarhed og evidens til at levere et endeligt, velbegrundet svar.
- Hukommelse og Tilstand: Fordi systemet opretholder tilstand og hukommelse på tværs af trin, kan det huske tidligere forsøg og deres resultater, undgå gentagelser og træffe mere informerede beslutninger, efterhånden som det skrider frem.
Over tid skaber dette en følelse af udviklende forståelse, der gør det muligt for modellen at navigere komplekse, flertrinsopgaver uden konstant menneskelig indgriben eller omformulering af prompten.
Håndtering af Fejltilstande og Selvkorrektion
Agentic RAG’s autonomi indebærer også robuste selvkorrigeringsmekanismer. Når systemet støder på blindgyder—såsom at hente irrelevante dokumenter eller støde på fejlbehæftede forespørgsler—kan det:
- Iterere og Genforespørge: I stedet for at returnere lavværdi-svar forsøger modellen nye søgestrategier, omskriver databaseforespørgsler eller undersøger alternative datasæt.
- Brug Diagnostiske Værktøjer: Systemet kan anvende yderligere funktioner designet til at hjælpe det med at fejlfinde sine ræsonnementstrin eller bekræfte korrektheden af hentede data. Værktøjer som Azure AI Tracing vil være vigtige for at muliggøre robust overvågning og sporing.
- Tilbagefald til Menneskelig Overvågning: For opgaver med høj risiko eller gentagne fejl kan modellen markere usikkerhed og anmode om menneskelig vejledning. Når mennesket giver korrigerende feedback, kan modellen inkorporere denne læring fremadrettet.
Denne iterative og dynamiske tilgang gør det muligt for modellen at forbedre sig kontinuerligt og sikrer, at den ikke bare er et engangssystem, men et system, der lærer af sine fejltrin under en given session.

Grænser for Agentic RAG
På trods af sin autonomi inden for en opgave er Agentic RAG ikke det samme som Artificial General Intelligence. Dens “agentiske” evner er begrænset til de værktøjer, datakilder og politikker, som menneskelige udviklere stiller til rådighed. Den kan ikke opfinde sine egne værktøjer eller træde uden for de domænegrænser, der er fastsat. I stedet udmærker den sig ved dynamisk at orkestrere de ressourcer, den har til rådighed.
Vigtige forskelle fra mere avancerede AI-former inkluderer:
- Domænespecifik Autonomi: Agentic RAG-systemer fokuserer på at opnå brugerdefinerede mål inden for et kendt domæne og anvender strategier som omskrivning af forespørgsler eller værktøjsvalg for at forbedre resultater.
- Afhængighed af Infrastruktur: Systemets evner afhænger af de værktøjer og data, som udviklere integrerer. Det kan ikke overskride disse grænser uden menneskelig indgriben.
- Respekt for Sikkerhedsforanstaltninger: Etiske retningslinjer, overholdelsesregler og forretningspolitikker forbliver meget vigtige. Agentens frihed er altid begrænset af sikkerhedsforanstaltninger og overvågningsmekanismer (forhåbentlig?).
Praktiske Anvendelser og Værdi
Agentic RAG udmærker sig i scenarier, der kræver iterativ forfining og præcision:
- Korrekthedsorienterede Miljøer: I overholdelseskontrol, regulatorisk analyse eller juridisk forskning kan den agentiske model gentagne gange verificere fakta, konsultere flere kilder og omskrive forespørgsler, indtil den producerer et grundigt gennemgået svar.
- Komplekse Databaseinteraktioner: Når der arbejdes med strukturerede data, hvor forespørgsler ofte kan fejle eller kræve justering, kan systemet selvstændigt forfine sine forespørgsler ved hjælp af Azure SQL eller Microsoft Fabric OneLake og sikre, at den endelige hentning stemmer overens med brugerens hensigt.
- Udvidede Arbejdsgange: Længerevarende sessioner kan udvikle sig, efterhånden som ny information dukker op. Agentic RAG kan løbende inkorporere nye data og ændre strategier, efterhånden som den lærer mere om problemområdet.
Styring, Gennemsigtighed og Tillid
Efterhånden som disse systemer bliver mere selvstændige i deres ræsonnement, er styring og gennemsigtighed afgørende:
- Forklarlig Ræsonnering: Modellen kan give en revisionsspor af de forespørgsler, den har lavet, de kilder, den har konsulteret, og de ræsonnementstrin, den har taget for at nå sin konklusion. Værktøjer som Azure AI Content Safety og Azure AI Tracing / GenAIOps kan hjælpe med at opretholde gennemsigtighed og reducere risici.
- Biaskontrol og Balanceret Informationshentning: Udviklere kan justere hentningsstrategier for at sikre, at balancerede og repræsentative datakilder overvejes, og regelmæssigt gennemgå outputs for at opdage bias eller skæve mønstre ved hjælp af brugerdefinerede modeller til avancerede data science-organisationer, der bruger Azure Machine Learning.
- Menneskelig Overvågning og Overholdelse: For følsomme opgaver forbliver menneskelig gennemgang essentiel. Agentic RAG erstatter ikke menneskelig dømmekraft i beslutninger med høj risiko—den supplerer den ved at levere mere grundigt gennemarbejdede muligheder.
At have værktøjer, der giver en klar registrering af handlinger, er afgørende. Uden dem kan det være meget vanskeligt at fejlfinde en flertrinsproces. Se følgende eksempel fra Literal AI (virksomheden bag Chainlit) for en Agent-run:


Konklusion
Agentic RAG repræsenterer en naturlig udvikling i, hvordan AI-systemer håndterer komplekse, dataintensive opgaver. Ved at anvende et loop-interaktionsmønster, selvstændigt vælge værktøjer og forfine forespørgsler, indtil der opnås et resultat af høj kvalitet, bevæger systemet sig ud over statisk prompt-følgen og bliver en mere adaptiv, kontekstbevidst beslutningstager. Selvom det stadig er begrænset af menneskedefinerede infrastrukturer og etiske retningslinjer, muliggør disse agentiske evner rigere, mere dynamiske og i sidste ende mere nyttige AI-interaktioner for både virksomheder og slutbrugere.
Har du flere spørgsmål om Agentic RAG?
Deltag i Azure AI Foundry Discord for at møde andre lærende, deltage i kontortid og få svar på dine spørgsmål om AI-agenter.
Yderligere Ressourcer
-
Implementering af Retrieval Augmented Generation (RAG) med Azure OpenAI Service: Lær hvordan du bruger dine egne data med Azure OpenAI Service. Denne Microsoft Learn-modul giver en omfattende guide til implementering af RAG
Akademiske artikler
Forrige lektion
Designmønster for værktøjsbrug
Næste lektion
Opbygning af troværdige AI-agenter
Ansvarsfraskrivelse:
Dette dokument er blevet oversat ved hjælp af AI-oversættelsestjenesten Co-op Translator. Selvom vi bestræber os på nøjagtighed, skal du være opmærksom på, at automatiserede oversættelser kan indeholde fejl eller unøjagtigheder. Det originale dokument på dets oprindelige sprog bør betragtes som den autoritative kilde. For kritisk information anbefales professionel menneskelig oversættelse. Vi påtager os intet ansvar for misforståelser eller fejltolkninger, der måtte opstå som følge af brugen af denne oversættelse.