ai-agents-for-beginners

Agentic RAG

(Klik på billedet ovenfor for at se videoen til denne lektion)

Agentic RAG

Denne lektion giver en omfattende introduktion til Agentic Retrieval-Augmented Generation (Agentic RAG), et nyt AI-paradigme, hvor store sprogmodeller (LLMs) selvstændigt planlægger deres næste skridt, mens de henter information fra eksterne kilder. I modsætning til statiske retrieval-then-read-mønstre involverer Agentic RAG iterative opkald til LLM’en, afbrudt af værktøjs- eller funktionskald og strukturerede outputs. Systemet evaluerer resultater, forfiner forespørgsler, anvender yderligere værktøjer, hvis nødvendigt, og fortsætter denne cyklus, indtil en tilfredsstillende løsning er opnået.

Introduktion

Denne lektion vil dække:

Læringsmål

Efter at have gennemført denne lektion vil du vide, hvordan du/forstå:

Hvad er Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) er et nyt AI-paradigme, hvor store sprogmodeller (LLMs) selvstændigt planlægger deres næste skridt, mens de henter information fra eksterne kilder. I modsætning til statiske retrieval-then-read-mønstre involverer Agentic RAG iterative opkald til LLM’en, afbrudt af værktøjs- eller funktionskald og strukturerede outputs. Systemet evaluerer resultater, forfiner forespørgsler, anvender yderligere værktøjer, hvis nødvendigt, og fortsætter denne cyklus, indtil en tilfredsstillende løsning er opnået. Denne iterative “maker-checker”-stil forbedrer korrekthed, håndterer fejlbehæftede forespørgsler og sikrer resultater af høj kvalitet.

Systemet tager aktivt ejerskab over sin beslutningsproces, omskriver fejlede forespørgsler, vælger forskellige metoder til informationshentning og integrerer flere værktøjer—såsom vektorsøgning i Azure AI Search, SQL-databaser eller brugerdefinerede API’er—før det færdiggør sit svar. Den afgørende kvalitet ved et agentisk system er dets evne til at eje sin beslutningsproces. Traditionelle RAG-implementeringer er afhængige af foruddefinerede veje, men et agentisk system bestemmer selv rækkefølgen af trin baseret på kvaliteten af den information, det finder.

Definition af Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) er et nyt paradigme inden for AI-udvikling, hvor LLM’er ikke kun henter information fra eksterne datakilder, men også selvstændigt planlægger deres næste skridt. I modsætning til statiske retrieval-then-read-mønstre eller nøje scriptede promptsekvenser involverer Agentic RAG et loop af iterative opkald til LLM’en, afbrudt af værktøjs- eller funktionskald og strukturerede outputs. Ved hver iteration evaluerer systemet de opnåede resultater, beslutter, om forespørgsler skal forfines, anvender yderligere værktøjer, hvis nødvendigt, og fortsætter denne cyklus, indtil en tilfredsstillende løsning er opnået.

Denne iterative “maker-checker”-stil er designet til at forbedre korrekthed, håndtere fejlbehæftede forespørgsler til strukturerede databaser (f.eks. NL2SQL) og sikre balancerede, høj-kvalitets resultater. I stedet for kun at stole på nøje udformede promptkæder tager systemet aktivt ejerskab over sin beslutningsproces. Det kan omskrive fejlede forespørgsler, vælge forskellige metoder til informationshentning og integrere flere værktøjer—såsom vektorsøgning i Azure AI Search, SQL-databaser eller brugerdefinerede API’er—før det færdiggør sit svar. Dette eliminerer behovet for overdrevent komplekse orkestreringsrammer. I stedet kan en relativt simpel loop af “LLM-opkald → værktøjsbrug → LLM-opkald → …” resultere i sofistikerede og velbegrundede outputs.

Agentic RAG Core Loop

Ejerskab af Beslutningsprocessen

Den afgørende kvalitet, der gør et system “agentisk,” er dets evne til at eje sin beslutningsproces. Traditionelle RAG-implementeringer er ofte afhængige af, at mennesker foruddefinerer en sti for modellen: en ræsonnementskæde, der beskriver, hvad der skal hentes, og hvornår. Men når et system er virkelig agentisk, beslutter det internt, hvordan det skal gribe problemet an. Det udfører ikke bare et script; det bestemmer selv rækkefølgen af trin baseret på kvaliteten af den information, det finder. For eksempel, hvis det bliver bedt om at udarbejde en produktlanceringsstrategi, er det ikke kun afhængigt af en prompt, der beskriver hele forsknings- og beslutningsarbejdsgangen. I stedet beslutter den agentiske model selvstændigt at:

  1. Hente aktuelle markedsrapporter ved hjælp af Bing Web Grounding.
  2. Identificere relevante konkurrentdata ved hjælp af Azure AI Search.
  3. Korrelere historiske interne salgsdata ved hjælp af Azure SQL Database.
  4. Syntetisere resultaterne til en sammenhængende strategi orkestreret via Azure OpenAI Service.
  5. Evaluere strategien for mangler eller inkonsistenser og igangsætte en ny runde af informationshentning, hvis nødvendigt. Alle disse trin—at forfine forespørgsler, vælge kilder, iterere, indtil svaret er tilfredsstillende—besluttes af modellen og er ikke foruddefineret af et menneske.

Iterative Loops, Værktøjsintegration og Hukommelse

Tool Integration Architecture

Et agentisk system er afhængigt af et loop-interaktionsmønster:

Over tid skaber dette en følelse af udviklende forståelse, der gør det muligt for modellen at navigere komplekse, flertrinsopgaver uden konstant menneskelig indgriben eller omformulering af prompten.

Håndtering af Fejltilstande og Selvkorrektion

Agentic RAG’s autonomi indebærer også robuste selvkorrigeringsmekanismer. Når systemet støder på blindgyder—såsom at hente irrelevante dokumenter eller støde på fejlbehæftede forespørgsler—kan det:

Denne iterative og dynamiske tilgang gør det muligt for modellen at forbedre sig kontinuerligt og sikrer, at den ikke bare er et engangssystem, men et system, der lærer af sine fejltrin under en given session.

Self Correction Mechanism

Grænser for Agentic RAG

På trods af sin autonomi inden for en opgave er Agentic RAG ikke det samme som Artificial General Intelligence. Dens “agentiske” evner er begrænset til de værktøjer, datakilder og politikker, som menneskelige udviklere stiller til rådighed. Den kan ikke opfinde sine egne værktøjer eller træde uden for de domænegrænser, der er fastsat. I stedet udmærker den sig ved dynamisk at orkestrere de ressourcer, den har til rådighed. Vigtige forskelle fra mere avancerede AI-former inkluderer:

  1. Domænespecifik Autonomi: Agentic RAG-systemer fokuserer på at opnå brugerdefinerede mål inden for et kendt domæne og anvender strategier som omskrivning af forespørgsler eller værktøjsvalg for at forbedre resultater.
  2. Afhængighed af Infrastruktur: Systemets evner afhænger af de værktøjer og data, som udviklere integrerer. Det kan ikke overskride disse grænser uden menneskelig indgriben.
  3. Respekt for Sikkerhedsforanstaltninger: Etiske retningslinjer, overholdelsesregler og forretningspolitikker forbliver meget vigtige. Agentens frihed er altid begrænset af sikkerhedsforanstaltninger og overvågningsmekanismer (forhåbentlig?).

Praktiske Anvendelser og Værdi

Agentic RAG udmærker sig i scenarier, der kræver iterativ forfining og præcision:

  1. Korrekthedsorienterede Miljøer: I overholdelseskontrol, regulatorisk analyse eller juridisk forskning kan den agentiske model gentagne gange verificere fakta, konsultere flere kilder og omskrive forespørgsler, indtil den producerer et grundigt gennemgået svar.
  2. Komplekse Databaseinteraktioner: Når der arbejdes med strukturerede data, hvor forespørgsler ofte kan fejle eller kræve justering, kan systemet selvstændigt forfine sine forespørgsler ved hjælp af Azure SQL eller Microsoft Fabric OneLake og sikre, at den endelige hentning stemmer overens med brugerens hensigt.
  3. Udvidede Arbejdsgange: Længerevarende sessioner kan udvikle sig, efterhånden som ny information dukker op. Agentic RAG kan løbende inkorporere nye data og ændre strategier, efterhånden som den lærer mere om problemområdet.

Styring, Gennemsigtighed og Tillid

Efterhånden som disse systemer bliver mere selvstændige i deres ræsonnement, er styring og gennemsigtighed afgørende:

At have værktøjer, der giver en klar registrering af handlinger, er afgørende. Uden dem kan det være meget vanskeligt at fejlfinde en flertrinsproces. Se følgende eksempel fra Literal AI (virksomheden bag Chainlit) for en Agent-run:

AgentRunExample

AgentRunExample2

Konklusion

Agentic RAG repræsenterer en naturlig udvikling i, hvordan AI-systemer håndterer komplekse, dataintensive opgaver. Ved at anvende et loop-interaktionsmønster, selvstændigt vælge værktøjer og forfine forespørgsler, indtil der opnås et resultat af høj kvalitet, bevæger systemet sig ud over statisk prompt-følgen og bliver en mere adaptiv, kontekstbevidst beslutningstager. Selvom det stadig er begrænset af menneskedefinerede infrastrukturer og etiske retningslinjer, muliggør disse agentiske evner rigere, mere dynamiske og i sidste ende mere nyttige AI-interaktioner for både virksomheder og slutbrugere.

Har du flere spørgsmål om Agentic RAG?

Deltag i Azure AI Foundry Discord for at møde andre lærende, deltage i kontortid og få svar på dine spørgsmål om AI-agenter.

Yderligere Ressourcer

- Implementering af Retrieval Augmented Generation (RAG) med Azure OpenAI Service: Lær hvordan du bruger dine egne data med Azure OpenAI Service. Denne Microsoft Learn-modul giver en omfattende guide til implementering af RAG

Akademiske artikler

Forrige lektion

Designmønster for værktøjsbrug

Næste lektion

Opbygning af troværdige AI-agenter


Ansvarsfraskrivelse:
Dette dokument er blevet oversat ved hjælp af AI-oversættelsestjenesten Co-op Translator. Selvom vi bestræber os på nøjagtighed, skal du være opmærksom på, at automatiserede oversættelser kan indeholde fejl eller unøjagtigheder. Det originale dokument på dets oprindelige sprog bør betragtes som den autoritative kilde. For kritisk information anbefales professionel menneskelig oversættelse. Vi påtager os intet ansvar for misforståelser eller fejltolkninger, der måtte opstå som følge af brugen af denne oversættelse.