ai-agents-for-beginners

Agentic RAG

(Klicka på bilden ovan för att se videon för denna lektion)

Agentic RAG

Den här lektionen ger en omfattande översikt av Agentic Retrieval-Augmented Generation (Agentic RAG), ett framväxande AI-paradigm där stora språkmodeller (LLMs) självständigt planerar sina nästa steg samtidigt som de hämtar information från externa källor. Till skillnad från statiska mönster där information hämtas och sedan läses, innebär Agentic RAG iterativa anrop till LLM, varvat med verktygs- eller funktionsanrop och strukturerade resultat. Systemet utvärderar resultat, förfinar frågor, använder ytterligare verktyg vid behov och fortsätter denna cykel tills en tillfredsställande lösning uppnås.

Introduktion

Den här lektionen kommer att täcka:

Lärandemål

Efter att ha slutfört denna lektion kommer du att kunna:

Vad är Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) är ett framväxande AI-paradigm där stora språkmodeller (LLMs) självständigt planerar sina nästa steg samtidigt som de hämtar information från externa källor. Till skillnad från statiska mönster där information hämtas och sedan läses, innebär Agentic RAG iterativa anrop till LLM, varvat med verktygs- eller funktionsanrop och strukturerade resultat. Systemet utvärderar resultat, förfinar frågor, använder ytterligare verktyg vid behov och fortsätter denna cykel tills en tillfredsställande lösning uppnås. Denna iterativa “maker-checker”-stil förbättrar korrekthet, hanterar felaktiga frågor och säkerställer högkvalitativa resultat.

Systemet äger aktivt sin resonemangsprocess, omskriver misslyckade frågor, väljer olika metoder för informationshämtning och integrerar flera verktyg—såsom vektorsökning i Azure AI Search, SQL-databaser eller anpassade API:er—innan det slutför sitt svar. Den särskiljande egenskapen hos ett agentiskt system är dess förmåga att äga sin resonemangsprocess. Traditionella RAG-implementeringar förlitar sig på fördefinierade vägar, men ett agentiskt system bestämmer självständigt sekvensen av steg baserat på kvaliteten på den information det hittar.

Definition av Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) är ett framväxande paradigm inom AI-utveckling där LLMs inte bara hämtar information från externa datakällor utan också självständigt planerar sina nästa steg. Till skillnad från statiska mönster där information hämtas och sedan läses eller noggrant skriptade promptsekvenser, innebär Agentic RAG en loop av iterativa anrop till LLM, varvat med verktygs- eller funktionsanrop och strukturerade resultat. Vid varje steg utvärderar systemet de resultat det har fått, beslutar om det ska förfina sina frågor, använder ytterligare verktyg vid behov och fortsätter denna cykel tills det uppnår en tillfredsställande lösning.

Denna iterativa “maker-checker”-stil är utformad för att förbättra korrekthet, hantera felaktiga frågor till strukturerade databaser (t.ex. NL2SQL) och säkerställa balanserade, högkvalitativa resultat. Snarare än att enbart förlita sig på noggrant utformade promptkedjor, äger systemet aktivt sin resonemangsprocess. Det kan omskriva frågor som misslyckas, välja olika metoder för informationshämtning och integrera flera verktyg—såsom vektorsökning i Azure AI Search, SQL-databaser eller anpassade API:er—innan det slutför sitt svar. Detta eliminerar behovet av överdrivet komplexa orkestreringsramverk. Istället kan en relativt enkel loop av “LLM-anrop → verktygsanvändning → LLM-anrop → …” ge sofistikerade och välgrundade resultat.

Agentic RAG Core Loop

Att äga resonemangsprocessen

Den särskiljande egenskapen som gör ett system “agentiskt” är dess förmåga att äga sin resonemangsprocess. Traditionella RAG-implementeringar förlitar sig ofta på att människor fördefinierar en väg för modellen: en tankekedja som beskriver vad som ska hämtas och när. Men när ett system är verkligt agentiskt, beslutar det internt hur det ska angripa problemet. Det utför inte bara ett skript; det bestämmer självständigt sekvensen av steg baserat på kvaliteten på den information det hittar. Till exempel, om det ombeds att skapa en produktlanseringsstrategi, förlitar det sig inte enbart på en prompt som beskriver hela forsknings- och beslutsprocessen. Istället beslutar den agentiska modellen självständigt att:

  1. Hämta aktuella marknadstrendrapporter med Bing Web Grounding.
  2. Identifiera relevant konkurrentdata med Azure AI Search.
  3. Korrelera historiska interna försäljningsmått med Azure SQL Database.
  4. Syntetisera insikterna till en sammanhängande strategi orkestrerad via Azure OpenAI Service.
  5. Utvärdera strategin för luckor eller inkonsekvenser och initiera en ny omgång informationshämtning vid behov. Alla dessa steg—att förfina frågor, välja källor, iterera tills modellen är “nöjd” med svaret—beslutas av modellen, inte förskrivna av en människa.

Iterativa loopar, verktygsintegration och minne

Tool Integration Architecture

Ett agentiskt system förlitar sig på ett loopat interaktionsmönster:

Med tiden skapar detta en känsla av utvecklande förståelse, vilket gör det möjligt för modellen att navigera komplexa, flerstegsuppgifter utan att en människa ständigt behöver ingripa eller omforma prompten.

Hantering av fel och självkorrigering

Agentic RAG:s autonomi innebär också robusta självkorrigeringsmekanismer. När systemet stöter på återvändsgränder—som att hämta irrelevanta dokument eller stöta på felaktiga frågor—kan det:

Denna iterativa och dynamiska metod gör det möjligt för modellen att kontinuerligt förbättras, vilket säkerställer att den inte bara är ett engångssystem utan ett som lär sig av sina misstag under en given session.

Self Correction Mechanism

Gränser för agentisk förmåga

Trots sin autonomi inom en uppgift är Agentic RAG inte detsamma som artificiell generell intelligens. Dess “agentiska” förmågor är begränsade till de verktyg, datakällor och policyer som tillhandahålls av mänskliga utvecklare. Det kan inte uppfinna egna verktyg eller gå utanför de domänbegränsningar som har satts. Istället briljerar det i att dynamiskt orkestrera de resurser som finns tillgängliga. Viktiga skillnader från mer avancerade AI-former inkluderar:

  1. Domänspecifik autonomi: Agentic RAG-system är fokuserade på att uppnå användardefinierade mål inom en känd domän, genom att använda strategier som omskrivning av frågor eller verktygsval för att förbättra resultat.
  2. Infrastrukturberoende: Systemets förmågor är beroende av de verktyg och data som integrerats av utvecklare. Det kan inte överskrida dessa gränser utan mänsklig intervention.
  3. Respekt för skyddsräcken: Etiska riktlinjer, efterlevnadsregler och affärspolicyer förblir mycket viktiga. Agentens frihet är alltid begränsad av säkerhetsåtgärder och övervakningsmekanismer (förhoppningsvis?).

Praktiska användningsfall och värde

Agentic RAG briljerar i scenarier som kräver iterativ förfining och precision:

  1. Miljöer med fokus på korrekthet: Vid efterlevnadskontroller, regulatorisk analys eller juridisk forskning kan den agentiska modellen upprepade gånger verifiera fakta, konsultera flera källor och omskriva frågor tills den producerar ett noggrant granskat svar.
  2. Komplexa databasinteraktioner: Vid arbete med strukturerad data där frågor ofta kan misslyckas eller behöva justeras, kan systemet självständigt förfina sina frågor med Azure SQL eller Microsoft Fabric OneLake, vilket säkerställer att den slutliga hämtningen överensstämmer med användarens avsikt.
  3. Utökade arbetsflöden: Längre sessioner kan utvecklas när ny information framkommer. Agentic RAG kan kontinuerligt införliva ny data och ändra strategier när det lär sig mer om problemområdet.

Styrning, transparens och förtroende

När dessa system blir mer autonoma i sitt resonemang är styrning och transparens avgörande:

Att ha verktyg som tillhandahåller en tydlig redovisning av åtgärder är avgörande. Utan dem kan det vara mycket svårt att felsöka en flerstegsprocess. Se följande exempel från Literal AI (företaget bakom Chainlit) för en Agent-run:

AgentRunExample

AgentRunExample2

Slutsats

Agentic RAG representerar en naturlig utveckling i hur AI-system hanterar komplexa, dataintensiva uppgifter. Genom att anta ett loopat interaktionsmönster, självständigt välja verktyg och förfina frågor tills ett högkvalitativt resultat uppnås, går systemet bortom statisk prompt-följning och blir en mer adaptiv, kontextmedveten beslutsfattare. Även om det fortfarande är begränsat av mänskligt definierade infrastrukturer och etiska riktlinjer, möjliggör dessa agentiska förmågor rikare, mer dynamiska och i slutändan mer användbara AI-interaktioner för både företag och slutanvändare.

Har du fler frågor om Agentic RAG?

Gå med i Azure AI Foundry Discord för att träffa andra elever, delta i öppet hus och få svar på dina frågor om AI-agenter.

Ytterligare resurser

- Implementera Retrieval Augmented Generation (RAG) med Azure OpenAI Service: Lär dig hur du använder din egen data med Azure OpenAI Service. Denna Microsoft Learn-modul ger en omfattande guide för att implementera RAG

Akademiska artiklar

Föregående lektion

Designmönster för verktygsanvändning

Nästa lektion

Bygga pålitliga AI-agenter


Ansvarsfriskrivning:
Detta dokument har översatts med hjälp av AI-översättningstjänsten Co-op Translator. Även om vi strävar efter noggrannhet, vänligen notera att automatiska översättningar kan innehålla fel eller felaktigheter. Det ursprungliga dokumentet på dess originalspråk bör betraktas som den auktoritativa källan. För kritisk information rekommenderas professionell mänsklig översättning. Vi ansvarar inte för eventuella missförstånd eller feltolkningar som uppstår vid användning av denna översättning.