ai-agents-for-beginners

Agentic RAG

(Klikk på bildet over for å se videoen til denne leksjonen)

Agentic RAG

Denne leksjonen gir en omfattende oversikt over Agentic Retrieval-Augmented Generation (Agentic RAG), et fremvoksende AI-paradigme der store språkmodeller (LLMs) autonomt planlegger sine neste steg mens de henter informasjon fra eksterne kilder. I motsetning til statiske mønstre for henting og lesing, innebærer Agentic RAG iterative kall til LLM, avbrutt av verktøy- eller funksjonskall og strukturerte utdata. Systemet evaluerer resultater, forbedrer forespørsler, bruker flere verktøy ved behov og fortsetter denne syklusen til en tilfredsstillende løsning er oppnådd.

Introduksjon

Denne leksjonen vil dekke:

Læringsmål

Etter å ha fullført denne leksjonen, vil du vite hvordan du/forstå:

Hva er Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) er et fremvoksende AI-paradigme der store språkmodeller (LLMs) autonomt planlegger sine neste steg mens de henter informasjon fra eksterne kilder. I motsetning til statiske mønstre for henting og lesing, innebærer Agentic RAG iterative kall til LLM, avbrutt av verktøy- eller funksjonskall og strukturerte utdata. Systemet evaluerer resultater, forbedrer forespørsler, bruker flere verktøy ved behov og fortsetter denne syklusen til en tilfredsstillende løsning er oppnådd. Denne iterative “maker-checker”-stilen forbedrer korrekthet, håndterer feilformede forespørsler og sikrer resultater av høy kvalitet.

Systemet eier aktivt sin resonnementprosess, omskriver mislykkede forespørsler, velger forskjellige metoder for henting og integrerer flere verktøy—som vektorsøk i Azure AI Search, SQL-databaser eller tilpassede API-er—før det gir sitt endelige svar. Den distinkte kvaliteten til et agentisk system er dets evne til å eie sin resonnementprosess. Tradisjonelle RAG-implementeringer er avhengige av forhåndsdefinerte veier, men et agentisk system bestemmer autonomt rekkefølgen av steg basert på kvaliteten på informasjonen det finner.

Definere Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) er et fremvoksende paradigme innen AI-utvikling der LLMs ikke bare henter informasjon fra eksterne datakilder, men også autonomt planlegger sine neste steg. I motsetning til statiske mønstre for henting og lesing eller nøye skriptede promptsekvenser, innebærer Agentic RAG en loop av iterative kall til LLM, avbrutt av verktøy- eller funksjonskall og strukturerte utdata. Ved hvert steg evaluerer systemet resultatene det har oppnådd, bestemmer om det skal forbedre forespørslene, bruker flere verktøy ved behov og fortsetter denne syklusen til det oppnår en tilfredsstillende løsning.

Denne iterative “maker-checker”-stilen er designet for å forbedre korrekthet, håndtere feilformede forespørsler til strukturerte databaser (f.eks. NL2SQL) og sikre balanserte, høykvalitetsresultater. I stedet for å være avhengig av nøye konstruerte promptkjeder, eier systemet aktivt sin resonnementprosess. Det kan omskrive forespørsler som mislykkes, velge forskjellige metoder for henting og integrere flere verktøy—som vektorsøk i Azure AI Search, SQL-databaser eller tilpassede API-er—før det gir sitt endelige svar. Dette eliminerer behovet for altfor komplekse orkestreringsrammeverk. I stedet kan en relativt enkel loop av “LLM-kall → verktøybruk → LLM-kall → …” gi sofistikerte og godt begrunnede utdata.

Agentic RAG Core Loop

Eie resonnementet

Den distinkte kvaliteten som gjør et system “agentisk” er dets evne til å eie sin resonnementprosess. Tradisjonelle RAG-implementeringer er ofte avhengige av at mennesker forhåndsdefinerer en vei for modellen: en tankerekke som skisserer hva som skal hentes og når.
Men når et system er virkelig agentisk, bestemmer det internt hvordan det skal nærme seg problemet. Det utfører ikke bare et skript; det bestemmer autonomt rekkefølgen av steg basert på kvaliteten på informasjonen det finner.
For eksempel, hvis det blir bedt om å lage en produktlanseringsstrategi, er det ikke avhengig av en prompt som beskriver hele forsknings- og beslutningsprosessen. I stedet bestemmer den agentiske modellen seg selvstendig for å:

  1. Hente rapporter om nåværende markedstrender ved hjelp av Bing Web Grounding.
  2. Identifisere relevant konkurrentdata ved hjelp av Azure AI Search.
  3. Korrelere historiske interne salgsmetrikker ved hjelp av Azure SQL Database.
  4. Syntetisere funnene til en sammenhengende strategi orkestrert via Azure OpenAI Service.
  5. Evaluere strategien for mangler eller inkonsistenser, og igangsette en ny runde med henting om nødvendig.

Alle disse stegene—forbedring av forespørsler, valg av kilder, iterering til modellen er “fornøyd” med svaret—bestemmes av modellen, ikke forhåndsskriptet av et menneske.

Iterative looper, verktøyintegrasjon og minne

Tool Integration Architecture

Et agentisk system er avhengig av et loopet interaksjonsmønster:

Over tid skaper dette en følelse av utviklende forståelse, som gjør det mulig for modellen å navigere komplekse, flertrinnsoppgaver uten at et menneske konstant må gripe inn eller omforme prompten.

Håndtering av feilmoduser og selvkorrigering

Agentic RAGs autonomi innebærer også robuste selvkorrigeringsmekanismer. Når systemet møter blindveier—som å hente irrelevante dokumenter eller støte på feilformede forespørsler—kan det:

Denne iterative og dynamiske tilnærmingen gjør det mulig for modellen å forbedre seg kontinuerlig, og sikrer at den ikke bare er et engangssystem, men et som lærer av sine feil under en gitt sesjon.

Self Correction Mechanism

Begrensninger av autonomi

Til tross for sin autonomi innenfor en oppgave, er Agentic RAG ikke analogt med kunstig generell intelligens. Dens “agentiske” evner er begrenset til verktøyene, datakildene og retningslinjene som er gitt av menneskelige utviklere. Den kan ikke finne opp sine egne verktøy eller gå utenfor de domenebegrensningene som er satt. I stedet utmerker den seg ved dynamisk å orkestrere ressursene som er tilgjengelige.
Viktige forskjeller fra mer avanserte AI-former inkluderer:

  1. Domenespesifikk autonomi: Agentic RAG-systemer fokuserer på å oppnå brukerdefinerte mål innenfor et kjent domene, og bruker strategier som omskriving av forespørsler eller verktøyvalg for å forbedre resultater.
  2. Avhengig av infrastruktur: Systemets evner er avhengige av verktøyene og dataene som er integrert av utviklere. Det kan ikke overskride disse grensene uten menneskelig inngripen.
  3. Respekt for sikkerhetsrammer: Etiske retningslinjer, samsvarsregler og forretningspolitikker forblir svært viktige. Agentens frihet er alltid begrenset av sikkerhetstiltak og tilsynsmekanismer (forhåpentligvis?).

Praktiske bruksområder og verdi

Agentic RAG utmerker seg i scenarier som krever iterativ forbedring og presisjon:

  1. Miljøer med fokus på korrekthet: I samsvarskontroller, regulatorisk analyse eller juridisk forskning kan den agentiske modellen gjentatte ganger verifisere fakta, konsultere flere kilder og omskrive forespørsler til den produserer et grundig gjennomgått svar.
  2. Komplekse databaseinteraksjoner: Når man arbeider med strukturerte data der forespørsler ofte kan mislykkes eller trenge justering, kan systemet autonomt forbedre sine forespørsler ved hjelp av Azure SQL eller Microsoft Fabric OneLake, og sikre at den endelige hentingen samsvarer med brukerens intensjon.
  3. Utvidede arbeidsflyter: Lengre sesjoner kan utvikle seg etter hvert som ny informasjon dukker opp. Agentic RAG kan kontinuerlig inkorporere ny data, endre strategier etter hvert som den lærer mer om problemområdet.

Styring, transparens og tillit

Etter hvert som disse systemene blir mer autonome i sitt resonnement, er styring og transparens avgjørende:

Å ha verktøy som gir en klar oversikt over handlinger er avgjørende. Uten dem kan det være svært vanskelig å feilsøke en flertrinnsprosess. Se følgende eksempel fra Literal AI (selskapet bak Chainlit) for en Agent-run:

AgentRunExample

Konklusjon

Agentic RAG representerer en naturlig utvikling i hvordan AI-systemer håndterer komplekse, dataintensive oppgaver. Ved å adoptere et loopet interaksjonsmønster, autonomt velge verktøy og forbedre forespørsler til det oppnår et høykvalitetsresultat, beveger systemet seg utover statisk prompt-følgning til en mer adaptiv, kontekstbevisst beslutningstaker. Selv om det fortsatt er begrenset av menneskedefinerte infrastrukturer og etiske retningslinjer, muliggjør disse agentiske evnene rikere, mer dynamiske og til slutt mer nyttige AI-interaksjoner for både bedrifter og sluttbrukere.

Har du flere spørsmål om Agentic RAG?

Bli med i Azure AI Foundry Discord for å møte andre lærende, delta på kontortimer og få svar på dine spørsmål om AI-agenter.

Tilleggsressurser

Akademiske artikler

Forrige leksjon

Designmønster for verktøybruk

Neste leksjon

Bygge pålitelige AI-agenter


Ansvarsfraskrivelse:
Dette dokumentet er oversatt ved hjelp av AI-oversettelsestjenesten Co-op Translator. Selv om vi tilstreber nøyaktighet, vær oppmerksom på at automatiserte oversettelser kan inneholde feil eller unøyaktigheter. Det originale dokumentet på sitt opprinnelige språk bør anses som den autoritative kilden. For kritisk informasjon anbefales profesjonell menneskelig oversettelse. Vi er ikke ansvarlige for eventuelle misforståelser eller feiltolkninger som oppstår ved bruk av denne oversettelsen.