ai-agents-for-beginners

Agentic RAG

(Klikk på bildet over for å se videoen til denne leksjonen)

Agentic RAG

Denne leksjonen gir en omfattende oversikt over Agentic Retrieval-Augmented Generation (Agentic RAG), et fremvoksende AI-paradigme der store språkmodeller (LLMs) autonomt planlegger sine neste steg samtidig som de henter informasjon fra eksterne kilder. I motsetning til statiske mønstre for henting og lesing, involverer Agentic RAG iterative kall til LLM, avbrutt av verktøy- eller funksjonskall og strukturerte utdata. Systemet evaluerer resultater, forbedrer forespørsler, bruker flere verktøy om nødvendig, og fortsetter denne syklusen til en tilfredsstillende løsning er oppnådd.

Introduksjon

Denne leksjonen vil dekke:

Læringsmål

Etter å ha fullført denne leksjonen, vil du vite hvordan du/forstå:

Hva er Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) er et fremvoksende AI-paradigme der store språkmodeller (LLMs) autonomt planlegger sine neste steg samtidig som de henter informasjon fra eksterne kilder. I motsetning til statiske mønstre for henting og lesing, involverer Agentic RAG iterative kall til LLM, avbrutt av verktøy- eller funksjonskall og strukturerte utdata. Systemet evaluerer resultater, forbedrer forespørsler, bruker flere verktøy om nødvendig, og fortsetter denne syklusen til en tilfredsstillende løsning er oppnådd. Denne iterative “maker-checker”-stilen forbedrer nøyaktighet, håndterer feilformede forespørsler og sikrer resultater av høy kvalitet.

Systemet eier aktivt sin resonneringsprosess, omskriver mislykkede forespørsler, velger ulike metoder for henting og integrerer flere verktøy—som vektorsøk i Azure AI Search, SQL-databaser eller tilpassede API-er—før det ferdigstiller svaret. Den særegne kvaliteten til et agentisk system er dets evne til å eie sin resonneringsprosess. Tradisjonelle RAG-implementeringer er avhengige av forhåndsdefinerte veier, men et agentisk system bestemmer autonomt rekkefølgen av steg basert på kvaliteten på informasjonen det finner.

Definere Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) er et fremvoksende paradigme innen AI-utvikling der LLMs ikke bare henter informasjon fra eksterne datakilder, men også autonomt planlegger sine neste steg. I motsetning til statiske mønstre for henting og lesing eller nøye skriptede promptsekvenser, involverer Agentic RAG en loop av iterative kall til LLM, avbrutt av verktøy- eller funksjonskall og strukturerte utdata. Ved hver vending evaluerer systemet resultatene det har oppnådd, bestemmer om det skal forbedre forespørslene, bruker flere verktøy om nødvendig, og fortsetter denne syklusen til det oppnår en tilfredsstillende løsning.

Denne iterative “maker-checker”-stilen er designet for å forbedre nøyaktighet, håndtere feilformede forespørsler til strukturerte databaser (f.eks. NL2SQL), og sikre balanserte, høykvalitetsresultater. I stedet for å stole utelukkende på nøye konstruerte promptkjeder, eier systemet aktivt sin resonneringsprosess. Det kan omskrive forespørsler som mislykkes, velge ulike metoder for henting og integrere flere verktøy—som vektorsøk i Azure AI Search, SQL-databaser eller tilpassede API-er—før det ferdigstiller svaret. Dette eliminerer behovet for overkompliserte orkestreringsrammeverk. I stedet kan en relativt enkel loop av “LLM-kall → verktøybruk → LLM-kall → …” gi sofistikerte og godt begrunnede utdata.

Agentic RAG Core Loop

Å eie resonneringsprosessen

Den særegne kvaliteten som gjør et system “agentisk” er dets evne til å eie sin resonneringsprosess. Tradisjonelle RAG-implementeringer er ofte avhengige av at mennesker forhåndsdefinerer en vei for modellen: en tankerekke som skisserer hva som skal hentes og når.
Men når et system er virkelig agentisk, bestemmer det internt hvordan det skal tilnærme seg problemet. Det utfører ikke bare et skript; det bestemmer autonomt rekkefølgen av steg basert på kvaliteten på informasjonen det finner.
For eksempel, hvis det blir bedt om å lage en produktlanseringsstrategi, stoler det ikke bare på en prompt som beskriver hele forsknings- og beslutningsprosessen. I stedet bestemmer den agentiske modellen selvstendig å:

  1. Hente rapporter om nåværende markedstrender ved hjelp av Bing Web Grounding.
  2. Identifisere relevant konkurrentdata ved hjelp av Azure AI Search.
  3. Korrelere historiske interne salgsdata ved hjelp av Azure SQL Database.
  4. Syntetisere funnene til en sammenhengende strategi orkestrert via Azure OpenAI Service.
  5. Evaluere strategien for hull eller inkonsekvenser, og eventuelt starte en ny runde med henting.
    Alle disse stegene—å forbedre forespørsler, velge kilder, iterere til det er “fornøyd” med svaret—blir bestemt av modellen, ikke forhåndsskriptet av et menneske.

Iterative looper, verktøyintegrasjon og minne

Tool Integration Architecture

Et agentisk system er avhengig av et loopet interaksjonsmønster:

Over tid skaper dette en følelse av utviklende forståelse, som gjør det mulig for modellen å navigere komplekse, flertrinnsoppgaver uten at et menneske konstant må gripe inn eller omforme prompten.

Håndtering av feilmoduser og selvkorrigering

Agentic RAGs autonomi innebærer også robuste selvkorrigeringsmekanismer. Når systemet møter blindveier—som å hente irrelevante dokumenter eller støte på feilformede forespørsler—kan det:

Denne iterative og dynamiske tilnærmingen lar modellen kontinuerlig forbedre seg, og sikrer at den ikke bare er et engangssystem, men et som lærer av sine feil i løpet av en gitt økt.

Self Correction Mechanism

Begrensninger av autonomi

Til tross for sin autonomi innenfor en oppgave, er ikke Agentic RAG det samme som kunstig generell intelligens. Dens “agentiske” evner er begrenset til verktøyene, datakildene og retningslinjene som er gitt av menneskelige utviklere. Den kan ikke finne opp sine egne verktøy eller gå utover de domenebegrensningene som er satt. I stedet utmerker den seg ved dynamisk å orkestrere ressursene som er tilgjengelige.
Viktige forskjeller fra mer avanserte AI-former inkluderer:

  1. Domenespesifikk autonomi: Agentic RAG-systemer er fokusert på å oppnå brukerdefinerte mål innenfor et kjent domene, og bruker strategier som omskriving av forespørsler eller verktøyvalg for å forbedre resultater.
  2. Avhengig av infrastruktur: Systemets evner er avhengige av verktøyene og dataene som er integrert av utviklere. Det kan ikke overskride disse grensene uten menneskelig inngripen.
  3. Respekt for sikkerhetsrammer: Etiske retningslinjer, samsvarsregler og forretningspolitikk forblir svært viktige. Agentens frihet er alltid begrenset av sikkerhetstiltak og tilsynsmekanismer (forhåpentligvis?).

Praktiske bruksområder og verdi

Agentic RAG utmerker seg i scenarier som krever iterativ forbedring og presisjon:

  1. Miljøer med fokus på korrekthet: I samsvarskontroller, regulatoriske analyser eller juridisk forskning kan den agentiske modellen gjentatte ganger verifisere fakta, konsultere flere kilder og omskrive forespørsler til den produserer et grundig gjennomgått svar.
  2. Komplekse databaseinteraksjoner: Når man arbeider med strukturerte data der forespørsler ofte kan mislykkes eller trenge justering, kan systemet autonomt forbedre forespørslene sine ved hjelp av Azure SQL eller Microsoft Fabric OneLake, og sikre at den endelige henting samsvarer med brukerens intensjon.
  3. Utvidede arbeidsflyter: Lengre økter kan utvikle seg etter hvert som ny informasjon dukker opp. Agentic RAG kan kontinuerlig inkorporere nye data og endre strategier etter hvert som den lærer mer om problemområdet.

Styring, åpenhet og tillit

Etter hvert som disse systemene blir mer autonome i sin resonnering, er styring og åpenhet avgjørende:

Å ha verktøy som gir en klar oversikt over handlinger er essensielt. Uten dem kan det være svært vanskelig å feilsøke en flertrinnsprosess. Se følgende eksempel fra Literal AI (selskapet bak Chainlit) for en Agent-kjøring:

AgentRunExample

AgentRunExample2

Konklusjon

Agentic RAG representerer en naturlig utvikling i hvordan AI-systemer håndterer komplekse, dataintensive oppgaver. Ved å adoptere et loopet interaksjonsmønster, autonomt velge verktøy og forbedre forespørsler til det oppnår et høykvalitetsresultat, beveger systemet seg utover statisk prompt-etterfølgelse til å bli en mer tilpasningsdyktig, kontekstbevisst beslutningstaker. Selv om det fortsatt er begrenset av menneskedefinerte infrastrukturer og etiske retningslinjer, muliggjør disse agentiske evnene rikere, mer dynamiske og til slutt mer nyttige AI-interaksjoner for både bedrifter og sluttbrukere.

Har du flere spørsmål om Agentic RAG?

Bli med i Azure AI Foundry Discord for å møte andre lærende, delta på kontortimer og få svar på dine spørsmål om AI-agenter.

Tilleggsressurser

- Implementering av Retrieval Augmented Generation (RAG) med Azure OpenAI Service: Lær hvordan du bruker dine egne data med Azure OpenAI Service. Denne Microsoft Learn-modulen gir en omfattende veiledning om implementering av RAG

Akademiske artikler

Forrige leksjon

Designmønster for verktøybruk

Neste leksjon

Bygge pålitelige AI-agenter


Ansvarsfraskrivelse:
Dette dokumentet er oversatt ved hjelp av AI-oversettelsestjenesten Co-op Translator. Selv om vi streber etter nøyaktighet, vær oppmerksom på at automatiske oversettelser kan inneholde feil eller unøyaktigheter. Det originale dokumentet på sitt opprinnelige språk bør anses som den autoritative kilden. For kritisk informasjon anbefales profesjonell menneskelig oversettelse. Vi er ikke ansvarlige for eventuelle misforståelser eller feiltolkninger som oppstår ved bruk av denne oversettelsen.