ai-agents-for-beginners

Agentic RAG

(Klikk bildet ovenfor for å se videoen til denne leksjonen)

Agentic RAG

Denne leksjonen gir en omfattende oversikt over Agentic Retrieval-Augmented Generation (Agentic RAG), et fremvoksende AI-paradigme hvor store språkmodeller (LLMer) autonomt planlegger sine neste steg samtidig som de henter informasjon fra eksterne kilder. I motsetning til statiske mønstre for “hent-deretter-les”, involverer Agentic RAG iterative kall til LLM-en, avbrutt av verktøy- eller funksjonskall og strukturerte utdata. Systemet evaluerer resultater, forbedrer forespørsler, kaller opp flere verktøy ved behov, og fortsetter denne syklusen til en tilfredsstillende løsning er oppnådd.

Introduction

Denne leksjonen vil dekke

Learning Goals

Etter å ha fullført denne leksjonen, vil du vite hvordan/forstå:

What is Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) er et fremvoksende AI-paradigme hvor store språkmodeller (LLMer) autonomt planlegger sine neste steg samtidig som de henter informasjon fra eksterne kilder. I motsetning til statiske mønstre for “hent-deretter-les”, involverer Agentic RAG iterative kall til LLM-en, avbrutt av verktøy- eller funksjonskall og strukturerte utdata. Systemet evaluerer resultater, forbedrer forespørsler, kaller opp flere verktøy ved behov, og fortsetter denne syklusen til en tilfredsstillende løsning er oppnådd. Denne iterative “maker-checker”-stilen forbedrer korrekthet, håndterer dårlige forespørsler og sikrer resultater av høy kvalitet.

Systemet eier aktivt sin resonnementprosess, omskriver feilede forespørsler, velger ulike innhentingsmetoder, og integrerer flere verktøy—slik som vektorsøk i Azure AI Search, SQL-databaser eller tilpassede API-er—før det ferdigstiller svaret. Det som skiller et agentisk system er dets evne til å eie resonnementprosessen. Tradisjonelle RAG-implementasjoner er avhengige av forhåndsdefinerte stier, men et agentisk system bestemmer autonomt rekkefølgen av steg basert på kvaliteten på informasjonen det finner.

Defining Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) er et fremvoksende paradigme i AI-utvikling hvor LLM-er ikke bare henter informasjon fra eksterne datakilder, men også autonomt planlegger sine neste steg. I motsetning til statiske mønstre for “hent-deretter-les” eller nøye skriptede promptsekvenser, involverer Agentic RAG en sløyfe av iterative kall til LLM-en, avbrutt av verktøy- eller funksjonskall og strukturerte utdata. Ved hver vending evaluerer systemet resultatene det har oppnådd, avgjør om det skal forbedre forespørslene, kaller opp ekstra verktøy hvis nødvendig, og fortsetter denne syklusen til det oppnår en tilfredsstillende løsning.

Denne iterative “maker-checker”-driftsstilen er utformet for å forbedre korrekthet, håndtere dårlige forespørsler til strukturerte databaser (f.eks. NL2SQL) og sikre balanserte, høykvalitetsresultater. I stedet for å stole utelukkende på nøye utformede promptkjeder, eier systemet aktivt sin resonnementprosess. Det kan omskrive forespørsler som feiler, velge forskjellige innhentingsmetoder og integrere flere verktøy—slik som vektorsøk i Azure AI Search, SQL-databaser eller tilpassede API-er—før det ferdigstiller svaret. Dette fjerner behovet for altfor komplekse orkestreringsrammeverk. I stedet kan en relativt enkel sløyfe av “LLM-kall → verktøysbruk → LLM-kall → …” gi sofistikerte og godt funderte utdata.

Agentic RAG Core Loop

Owning the Reasoning Process

Den kjennende egenskapen som gjør et system “agentisk” er dets evne til å eie sin resonnementprosess. Tradisjonelle RAG-implementasjoner er ofte avhengige av at mennesker forhåndsdefinerer en sti for modellen: en chain-of-thought som skisserer hva som skal hentes og når. Men når et system virkelig er agentisk, bestemmer det internt hvordan det skal nærme seg problemet. Det utfører ikke bare et skript; det avgjør autonomt rekkefølgen av steg basert på kvaliteten på informasjonen det finner. For eksempel, hvis det blir bedt om å lage en produktlanseringsstrategi, stoler det ikke bare på en prompt som beskriver hele forsknings- og beslutningsarbeidsflyten. I stedet bestemmer den agentiske modellen selvstendig å:

  1. Retrieve current market trend reports using Bing Web Grounding
  2. Identify relevant competitor data using Azure AI Search.
  3. Correlate historical internal sales metrics using Azure SQL Database.
  4. Synthesize the findings into a cohesive strategy orchestrated via Azure OpenAI Service.
  5. Evaluate the strategy for gaps or inconsistencies, prompting another round of retrieval if necessary. Alle disse stegene—forbedring av forespørsler, valg av kilder, iterering til den er “fornøyd” med svaret—avgjøres av modellen, ikke forhåndsprogrammert av et menneske.

Iterative Loops, Tool Integration, and Memory

Tool Integration Architecture

Et agentisk system er avhengig av et sløyfeinteraksjonsmønster:

Over tid skaper dette en følelse av utviklende forståelse, som gjør modellen i stand til å navigere komplekse, flerstegsoppgaver uten at et menneske stadig må gripe inn eller omforme prompten.

Handling Failure Modes and Self-Correction

Agentic RAGs autonomi innebærer også robuste selvkorrigeringsmekanismer. Når systemet treffer blindveier—som å hente irrelevante dokumenter eller støte på dårlige forespørsler—kan det:

Denne iterative og dynamiske tilnærmingen gjør at modellen kan forbedre seg kontinuerlig, og sikrer at den ikke bare er et engangssystem, men en som lærer av sine feil i løpet av en gitt økt.

Self Correction Mechanism

Boundaries of Agency

Til tross for sin autonomi innen en oppgave, er Agentic RAG ikke analogt med Artificial General Intelligence. Dets “agentiske” kapasiteter er begrenset til verktøyene, datakildene og policyene som er levert av menneskelige utviklere. Det kan ikke oppfinne sine egne verktøy eller gå utenfor de domenegrensene som er satt. Snarere utmerker det seg i å dynamisk orkestrere ressursene som er tilgjengelige. Nøkkelforskjeller fra mer avanserte AI-former inkluderer:

  1. Domain-Specific Autonomy: Agentic RAG-systemer er fokusert på å oppnå brukerdefinerte mål innen et kjent domene, og benytter strategier som omskriving av forespørsler eller valg av verktøy for å forbedre resultater.
  2. Infrastructure-Dependent: Systemets kapasiteter avhenger av verktøyene og dataene som er integrert av utviklere. Det kan ikke overstige disse grensene uten menneskelig inngripen.
  3. Respect for Guardrails: Etiske retningslinjer, samsvarsregler og forretningspolicies forblir svært viktige. Agentens frihet er alltid begrenset av sikkerhetstiltak og tilsynsmekanismer (forhåpentligvis).

Practical Use Cases and Value

Agentic RAG skinner i scenarier som krever iterativ forbedring og presisjon:

  1. Correctness-First Environments: I samsvarskontroller, regulatorisk analyse eller juridisk forskning kan den agentiske modellen gjentatte ganger verifisere fakta, konsultere flere kilder og omskrive forespørsler til den leverer et grundig gjennomgått svar.
  2. Complex Database Interactions: Når man arbeider med strukturerte data der forespørsler ofte kan feile eller trenge justering, kan systemet autonomt forbedre sine spørringer ved hjelp av Azure SQL eller Microsoft Fabric OneLake, og sikre at den endelige innhentingen samsvarer med brukerens intensjon.
  3. Extended Workflows: Lengre økter kan utvikle seg etter hvert som ny informasjon dukker opp. Agentic RAG kan kontinuerlig innlemme nye data og endre strategier etter hvert som den lærer mer om problemområdet.

Governance, Transparency, and Trust

Ettersom disse systemene blir mer autonome i sitt resonnement, er styring og transparens avgjørende:

Å ha verktøy som gir en klar oversikt over handlinger er essensielt. Uten dem kan feilsøking av en flertrinnsprosess være svært vanskelig. Se følgende eksempel fra Literal AI (selskapet bak Chainlit) for en Agent-run:

AgentRunExample

Conclusion

Agentic RAG representerer en naturlig evolusjon i hvordan AI-systemer håndterer komplekse, dataintensive oppgaver. Ved å ta i bruk et sløyfeinteraksjonsmønster, autonomt velge verktøy og forbedre forespørsler til det oppnår et høykvalitetsresultat, går systemet utover statisk prompt-utførelse til en mer adaptiv, kontekstbevisst beslutningstaker. Selv om det fortsatt er bundet av menneskedefinerte infrastrukturer og etiske retningslinjer, gjør disse agentiske evnene AI-interaksjoner rikere, mer dynamiske og i siste instans mer nyttige for både bedrifter og sluttbrukere.

Got More Questions about Agentic RAG?

Join the Microsoft Foundry Discord to meet with other learners, attend office hours and get your AI Agents questions answered.

Additional Resources

Akademiske artikler

Forrige leksjon

Designmønster for verktøybruk

Neste leksjon

Bygge pålitelige AI-agenter


Ansvarsfraskrivelse: Dette dokumentet er oversatt ved hjelp av AI-oversettelsestjenesten Co-op Translator (https://github.com/Azure/co-op-translator). Selv om vi streber etter nøyaktighet, må du være oppmerksom på at automatiske oversettelser kan inneholde feil eller unøyaktigheter. Det opprinnelige dokumentet på sitt originale språk bør betraktes som den autoritative kilden. For kritisk informasjon anbefales profesjonell, menneskelig oversettelse. Vi påtar oss ikke ansvar for eventuelle misforståelser eller feiltolkninger som oppstår ved bruk av denne oversettelsen.