ai-agents-for-beginners

Agentic RAG

(Klicka på bilden ovan för att se videon av denna lektion)

Agentic RAG

Denna lektion ger en omfattande översikt över Agentic Retrieval-Augmented Generation (Agentic RAG), ett framväxande AI-paradigm där stora språkmodeller (LLM:er) självständigt planerar sina nästa steg samtidigt som de hämtar information från externa källor. Till skillnad från statiska mönster med först hämtning och sedan läsning, inkluderar Agentic RAG iterativa anrop till LLM, varvat med verktygs- eller funktionsanrop och strukturerade utdata. Systemet utvärderar resultat, förfinar frågor, anropar ytterligare verktyg vid behov och fortsätter denna cykel tills en tillfredsställande lösning uppnås.

Introduktion

Denna lektion kommer att täcka

Lärandemål

Efter att ha slutfört denna lektion kommer du att kunna/förstå:

Vad är Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) är ett framväxande AI-paradigm där stora språkmodeller (LLM) självständigt planerar sina nästa steg samtidigt som de hämtar information från externa källor. Till skillnad från statiska mönster med först hämtning och sedan läsning, involverar Agentic RAG iterativa anrop till LLM, varvat med verktygs- eller funktionsanrop och strukturerade utdata. Systemet utvärderar resultaten, förfinar frågor, anropar ytterligare verktyg vid behov och fortsätter denna cykel tills en tillfredsställande lösning uppnås. Denna iterativa ”maker-checker”-stil förbättrar korrekthet, hanterar felaktiga frågor och säkerställer högkvalitativa resultat.

Systemet äger aktivt sitt resonemangsprocess, skriver om misslyckade frågor, väljer olika återvinningsmetoder och integrerar flera verktyg — som vektorsökning i Azure AI Search, SQL-databaser eller anpassade API:er — innan det slutför sitt svar. Den utmärkande egenskapen hos ett agentiskt system är dess förmåga att äga sin resonemangsprocess. Traditionella RAG-implementeringar förlitar sig på fördefinierade vägar, men ett agentiskt system avgör självständigt sekvensen av steg baserat på kvaliteten på den information det hittar.

Definiera Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) är ett framväxande paradigm inom AI-utveckling där LLM inte bara hämtar information från externa datakällor utan också självständigt planerar sina nästa steg. Till skillnad från statiska mönster med först hämtning och sedan läsning eller noggrant skriptade promptsekvenser involverar Agentic RAG en loop av iterativa anrop till LLM, varvat med verktygs- eller funktionsanrop och strukturerade utdata. Vid varje steg utvärderar systemet de resultat det fått, beslutar om det ska förfina sina frågor, anropar ytterligare verktyg vid behov och fortsätter denna cykel tills det uppnår en tillfredsställande lösning.

Denna iterativa ”maker-checker”-stil av drift är utformad för att förbättra korrekthet, hantera felaktiga frågor till strukturerade databaser (t.ex. NL2SQL) och säkerställa balanserade, högkvalitativa resultat. Istället för att enbart förlita sig på noggrant konstruerade promptkedjor äger systemet aktivt sitt resonemang. Det kan skriva om misslyckade frågor, välja olika återvinningsmetoder och integrera flera verktyg — såsom vektorsökning i Azure AI Search, SQL-databaser eller anpassade API:er — innan det slutför sitt svar. Detta eliminerar behovet av alltför komplexa orkestreringsramverk. Istället kan en relativt enkel loop av ”LLM-anrop → verktygsanvändning → LLM-anrop → …” ge sofistikerade och välgrundade utdata.

Agentic RAG Core Loop

Äga resonemangsprocessen

Den utmärkande egenskapen som gör ett system ”agentiskt” är dess förmåga att äga sitt resonemang. Traditionella RAG-implementeringar är ofta beroende av att människor fördefinierar en väg för modellen: en kedja av tankar som skisserar vad som ska hämtas och när. Men när ett system är verkligt agentiskt bestämmer det internt hur problemet ska angripas. Det utför inte bara ett skript; det avgör helt själv sekvensen av steg baserat på kvaliteten på den information det hittar. Till exempel, om det får i uppdrag att skapa en produktlanseringsstrategi förlitar det sig inte bara på en prompt som redogör för hela forsknings- och beslutsprocessen. Istället bestämmer den agentiska modellen självständigt att:

  1. Hämta aktuella marknadstrendrapporter med Bing Web Grounding
  2. Identifiera relevant konkurrentdata med Azure AI Search
  3. Korrelera historiska interna försäljningsmått med Azure SQL Database
  4. Syntetisera resultaten till en sammanhängande strategi orkestrerad via Azure OpenAI Service
  5. Utvärdera strategin för luckor eller inkonsekvenser och initiera ytterligare hämtning vid behov Alla dessa steg — att förfina frågor, välja källor, iterera tills den är ”nöjd” med svaret — beslutas av modellen, inte förskrivet av en människa.

Iterativa loopar, verktygsintegration och minne

Tool Integration Architecture

Ett agentiskt system förlitar sig på ett loopat interaktionsmönster:

Med tiden skapar detta en känsla av utvecklande förståelse som gör det möjligt för modellen att navigera i komplexa, flerstegsuppgifter utan att en människa behöver ingripa eller omforma prompten kontinuerligt.

Hantering av fel och självkorrigering

Agentic RAG:s autonomi innefattar också robusta mekanismer för självkorrigering. När systemet stöter på återvändsgränder — såsom att hämta irrelevanta dokument eller stöta på felaktiga frågor — kan det:

Denna iterativa och dynamiska metod låter modellen förbättras kontinuerligt och säkerställer att det inte bara är ett engångssystem utan ett som lär sig av sina misstag under en given session.

Self Correction Mechanism

Gränser för agency

Trots sin autonomi inom en uppgift är Agentic RAG inte liktydigt med artificiell generell intelligens. Dess ”agentiska” kapabiliteter är begränsade till verktygen, datakällorna och policys som tillhandahålls av mänskliga utvecklare. Den kan inte skapa egna verktyg eller gå utanför de domänbegränsningar som satts. Den utmärker sig istället i att dynamiskt orkestrera tillgängliga resurser. Viktiga skillnader från mer avancerade AI-former inkluderar:

  1. Domänspecifik autonomi: Agentic RAG-system fokuserar på att uppnå användardefinierade mål inom en känd domän, med strategier som omskrivning av frågor eller verktygsval för att förbättra resultat.
  2. Infrastrukturberoende: Systemets kapaciteter är beroende av de verktyg och data som integrerats av utvecklarna. Den kan inte överskrida dessa gränser utan mänsklig inblandning.
  3. Respekt för styrregler: Etiska riktlinjer, compliance-regler och affärspolicys förblir mycket viktiga. Agentens frihet är alltid begränsad av säkerhetsåtgärder och tillsynsmekanismer (förhoppningsvis?)

Praktiska användningsfall och värde

Agentic RAG utmärker sig i scenarier som kräver iterativ förfining och precision:

  1. Miljöer med fokus på korrekthet: Vid regelefterlevnadskontroller, regulatorisk analys eller juridisk forskning kan den agentiska modellen upprepade gånger verifiera fakta, konsultera flera källor och skriva om frågor tills den producerar ett noggrant granskat svar.
  2. Komplexa databasinteraktioner: Vid hantering av strukturerad data där frågor ofta kan misslyckas eller behöva justeras kan systemet självständigt förfina sina frågor med Azure SQL eller Microsoft Fabric OneLake, vilket säkerställer att slutresultatet överensstämmer med användarens avsikt.
  3. Förlängda arbetsflöden: Längre sessioner kan utvecklas när ny information framkommer. Agentic RAG kan kontinuerligt inkorporera ny data och ändra strategier allteftersom den lär sig mer om problemområdet.

Styrning, transparens och förtroende

När dessa system blir självgående i sitt resonemang blir styrning och transparens avgörande:

Att ha verktyg som ger en klar redovisning av åtgärder är väsentligt. Utan dessa kan felsökning av en flerstegsprocess vara mycket svår. Se följande exempel från Literal AI (företaget bakom Chainlit) för en agentkörning:

AgentRunExample

Slutsats

Agentic RAG representerar en naturlig utveckling i hur AI-system hanterar komplexa, dataintensiva uppgifter. Genom att anta ett loopat interaktionsmönster, autonomt välja verktyg och förfina frågor tills ett högkvalitativt resultat uppnås, rör sig systemet bortom statiskt promptföljande till en mer adaptiv, kontextmedveten beslutsfattare. Trots att det fortfarande är begränsat av mänskligt definierad infrastruktur och etiska riktlinjer, möjliggör dessa agentiska kapabiliteter rikare, mer dynamiska och slutligen mer användbara AI-interaktioner för både företag och användare.

Har du fler frågor om Agentic RAG?

Gå med i Microsoft Foundry Discord för att träffa andra elever, delta i kontorstider och få svar på dina frågor om AI-agenter.

Ytterligare resurser

Akademiska artiklar

Föregående lektion

Tool Use Design Pattern

Nästa lektion

Building Trustworthy AI Agents


Ansvarsfriskrivning:
Detta dokument har översatts med hjälp av AI-översättningstjänsten Co-op Translator. Vi strävar efter noggrannhet, men var vänlig observera att automatiska översättningar kan innehålla fel eller brister. Det ursprungliga dokumentet på dess originalspråk bör betraktas som den auktoritativa källan. För kritisk information rekommenderas professionell mänsklig översättning. Vi ansvarar inte för några missförstånd eller feltolkningar som uppstår till följd av denna översättning.