ai-agents-for-beginners

Agentic RAG

(Faceți clic pe imaginea de mai sus pentru a viziona videoclipul acestei lecții)

Agentic RAG

Această lecție oferă o prezentare cuprinzătoare a Agentic Retrieval-Augmented Generation (Agentic RAG), un paradigme emergentă în AI în care modelele lingvistice mari (LLM) își planifică în mod autonom pașii următori în timp ce extrag informații din surse externe. Spre deosebire de modelele statice de tip retrieval-then-read, Agentic RAG implică apeluri iterative către LLM, presărate cu apeluri către instrumente sau funcții și output-uri structurate. Sistemul evaluează rezultatele, rafinează interogările, invocă instrumente suplimentare dacă este necesar și continuă acest ciclu până când se obține o soluție satisfăcătoare.

Introduction

Această lecție va acoperi

Learning Goals

După finalizarea acestei lecții, veți ști cum să/înțelegeți:

What is Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) este un paradigm emergent în AI în care modelele lingvistice mari (LLM) își planifică în mod autonom pașii următori în timp ce extrag informații din surse externe. Spre deosebire de modelele statice de tip retrieval-then-read, Agentic RAG implică apeluri iterative către LLM, presărate cu apeluri către instrumente sau funcții și output-uri structurate. Sistemul evaluează rezultatele, rafinează interogările, invocă instrumente suplimentare dacă este necesar și continuă acest ciclu până când se obține o soluție satisfăcătoare. Acest stil iterativ „maker-checker” îmbunătățește corectitudinea, gestionează interogările malformate și asigură rezultate de înaltă calitate.

Sistemul își asumă în mod activ procesul de raționament, rescriind interogările eșuate, alegând metode diferite de recuperare și integrând multiple instrumente — cum ar fi vector search în Azure AI Search, baze de date SQL sau API-uri personalizate — înainte de a-și finaliza răspunsul. Calitatea distinctivă a unui sistem agentic este capacitatea sa de a-și asuma propriul proces de raționament. Implementările tradiționale RAG se bazează pe căi predefinite, dar un sistem agentic determină în mod autonom secvența de pași pe baza calității informațiilor pe care le găsește.

Defining Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) este un paradigm emergent în dezvoltarea AI în care LLM-urile nu doar extrag informații din surse de date externe, ci și își planifică în mod autonom pașii următori. Spre deosebire de modelele statice retrieval-then-read sau de secvențele de prompturi atent scriptate, Agentic RAG implică o buclă de apeluri iterative către LLM, presărate cu apeluri către instrumente sau funcții și output-uri structurate. La fiecare pas, sistemul evaluează rezultatele obținute, decide dacă trebuie să rafineze interogările, invocă instrumente suplimentare dacă este nevoie și continuă acest ciclu până când obține o soluție satisfăcătoare.

Acest stil iterativ „maker-checker” este conceput pentru a îmbunătăți corectitudinea, a gestiona interogările malformate către baze de date structurate (de ex. NL2SQL) și a asigura rezultate echilibrate și de înaltă calitate. În loc să se bazeze exclusiv pe lanțuri de prompturi atent proiectate, sistemul își asumă activ procesul de raționament. Poate rescrie interogările care eșuează, alege metode de recuperare diferite și integrează multiple instrumente — cum ar fi vector search în Azure AI Search, baze de date SQL sau API-uri personalizate — înainte de a finaliza răspunsul. Aceasta elimină necesitatea unor cadre de orchestrare excesiv de complexe. În schimb, o buclă relativ simplă de „apel LLM → utilizare instrument → apel LLM → …” poate genera output-uri sofisticate și bine fundamentate.

Agentic RAG Core Loop

Owning the Reasoning Process

Calitatea distinctivă care face un sistem „agentic” este capacitatea sa de a-și asuma procesul de raționament. Implementările tradiționale RAG depind adesea de oameni care predefiniesc o cale pentru model: un chain-of-thought care descrie ce să recupereze și când. Dar atunci când un sistem este cu adevărat agentic, acesta decide intern cum să abordeze problema. Nu execută doar un script; determină în mod autonom secvența de pași pe baza calității informațiilor pe care le găsește. De exemplu, dacă i se cere să creeze o strategie de lansare a unui produs, nu se bazează exclusiv pe un prompt care descrie întregul flux de lucru pentru cercetare și luarea deciziilor. În schimb, modelul agentic decide independent să:

  1. Retrieve current market trend reports using Bing Web Grounding
  2. Identify relevant competitor data using Azure AI Search.
  3. Correlate historical internal sales metrics using Azure SQL Database.
  4. Synthesize the findings into a cohesive strategy orchestrated via Azure OpenAI Service.
  5. Evaluate the strategy for gaps or inconsistencies, prompting another round of retrieval if necessary. Toate aceste etape — rafinarea interogărilor, alegerea surselor, iterarea până când este „mulțumit” de răspuns — sunt decise de model, nu pre-scriptate de un om.

Iterative Loops, Tool Integration, and Memory

Tool Integration Architecture

Un sistem agentic se bazează pe un model de interacțiune în buclă:

În timp, aceasta creează un sentiment de înțelegere în evoluție, permițând modelului să navigheze sarcini complexe în mai mulți pași fără a necesita intervenția constantă a unui om sau remodelarea promptului.

Handling Failure Modes and Self-Correction

Autonomia Agentic RAG implică, de asemenea, mecanisme robuste de autocorecție. Când sistemul întâmpină impasuri — cum ar fi recuperarea unor documente irelevante sau întâlnirea unor interogări malformate — acesta poate:

Această abordare iterativă și dinamică permite modelului să se îmbunătățească continuu, asigurând că nu este doar un sistem one-shot, ci unul care învață din greșelile sale în timpul unei sesiuni date.

Self Correction Mechanism

Boundaries of Agency

În ciuda autonomiei sale în cadrul unei sarcini, Agentic RAG nu este analog cu Inteligența Artificială Generală. Capacitățile sale „agentice” sunt limitate la instrumentele, sursele de date și politicile furnizate de dezvoltatorii umani. Nu își poate inventa propriile instrumente sau ieși în afara limitelor domeniului stabilite. În schimb, excelează în orchestrarea dinamică a resurselor la dispoziție. Diferențe cheie față de formele mai avansate de AI includ:

  1. Domain-Specific Autonomy: Sistemele Agentic RAG sunt concentrate pe atingerea obiectivelor definite de utilizator în cadrul unui domeniu cunoscut, folosind strategii precum rescrierea interogărilor sau selecția instrumentelor pentru a îmbunătăți rezultatele.
  2. Infrastructure-Dependent: Capacitățile sistemului depind de instrumentele și datele integrate de dezvoltatori. Nu poate depăși aceste limite fără intervenție umană.
  3. Respect for Guardrails: Ghidurile etice, regulile de conformitate și politicile de business rămân foarte importante. Libertatea agentului este întotdeauna constrânsă de măsurile de siguranță și mecanismele de supraveghere (sperăm).

Practical Use Cases and Value

Agentic RAG strălucește în scenarii care necesită rafinare iterativă și precizie:

  1. Correctness-First Environments: În verificări de conformitate, analize reglamentare sau cercetare juridică, modelul agentic poate verifica repetat faptele, consulta multiple surse și rescrie interogările până când produce un răspuns complet verificat.
  2. Complex Database Interactions: Când se lucrează cu date structurate unde interogările pot eșua frecvent sau necesita ajustări, sistemul poate rafina autonom interogările folosind Azure SQL sau Microsoft Fabric OneLake, asigurând că recuperarea finală se aliniază cu intenția utilizatorului.
  3. Extended Workflows: Sesiunile cu durată mai lungă se pot transforma pe măsură ce apar informații noi. Agentic RAG poate încorpora continuu date noi, schimbând strategiile pe măsură ce învață mai multe despre domeniul problemei.

Governance, Transparency, and Trust

Pe măsură ce aceste sisteme devin mai autonome în raționamentul lor, guvernanța și transparența devin cruciale:

A avea instrumente care oferă un registru clar al acțiunilor este esențial. Fără ele, depanarea unui proces în mai mulți pași poate fi foarte dificilă. Vezi exemplul următor de la Literal AI (company behind Chainlit) pentru o rulare a agentului:

AgentRunExample

Conclusion

Agentic RAG reprezintă o evoluție naturală în modul în care sistemele AI gestionează sarcini complexe, intensive în date. Prin adoptarea unui model de interacțiune în buclă, selectarea autonomă a instrumentelor și rafinarea interogărilor până la obținerea unui rezultat de înaltă calitate, sistemul trece dincolo de urmarea statică a prompturilor spre un factor de decizie mai adaptiv și conștient de context. Deși rămâne încadrat de infrastructuri și ghiduri etice definite de oameni, aceste capabilități agentice permit interacțiuni AI mai bogate, mai dinamice și, în final, mai utile pentru întreprinderi și utilizatori finali.

Got More Questions about Agentic RAG?

Join the Microsoft Foundry Discord to meet with other learners, attend office hours and get your AI Agents questions answered.

Additional Resources

Lucrări academice

Lecția anterioară

Model de proiectare pentru utilizarea instrumentelor

Lecția următoare

Construirea agenților AI de încredere


Disclaimer: Acest document a fost tradus folosind serviciul de traducere AI Co-op Translator. Deși ne străduim pentru acuratețe, vă rugăm să rețineți că traducerile automate pot conține erori sau inexactități. Documentul original în limba sa nativă trebuie considerat sursa autoritativă. Pentru informații critice, se recomandă o traducere profesională efectuată de un traducător uman. Nu ne asumăm răspunderea pentru eventualele neînțelegeri sau interpretări greșite care rezultă din utilizarea acestei traduceri.