ai-agents-for-beginners

Agentic RAG

(Faceți clic pe imaginea de mai sus pentru a viziona videoclipul acestei lecții)

Agentic RAG

Această lecție oferă o prezentare cuprinzătoare a Agentic Retrieval-Augmented Generation (Agentic RAG), un nou paradigm AI în care modelele de limbaj mari (LLMs) planifică autonom pașii următori în timp ce extrag informații din surse externe. Spre deosebire de modelele statice de tip „retrieval-then-read”, Agentic RAG implică apeluri iterative către LLM, intercalate cu utilizarea de instrumente sau funcții și producții structurate. Sistemul evaluează rezultatele, rafinează interogările, invocă instrumente suplimentare dacă este necesar și continuă acest ciclu până când se obține o soluție satisfăcătoare.

Introducere

Această lecție va acoperi:

Obiective de Învățare

După finalizarea acestei lecții, veți ști cum să/veți înțelege:

Ce este Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) este un nou paradigm AI în care modelele de limbaj mari (LLMs) planifică autonom pașii următori în timp ce extrag informații din surse externe. Spre deosebire de modelele statice de tip „retrieval-then-read”, Agentic RAG implică apeluri iterative către LLM, intercalate cu utilizarea de instrumente sau funcții și producții structurate. Sistemul evaluează rezultatele, rafinează interogările, invocă instrumente suplimentare dacă este necesar și continuă acest ciclu până când se obține o soluție satisfăcătoare. Acest stil iterativ „maker-checker” îmbunătățește corectitudinea, gestionează interogările defectuoase și asigură rezultate de înaltă calitate.

Sistemul deține activ procesul său de raționament, rescriind interogările eșuate, alegând metode diferite de extragere și integrând multiple instrumente—cum ar fi căutarea vectorială în Azure AI Search, baze de date SQL sau API-uri personalizate—înainte de a finaliza răspunsul. Calitatea distinctivă a unui sistem agentic este capacitatea sa de a deține procesul său de raționament. Implementările tradiționale RAG se bazează pe căi predefinite, dar un sistem agentic determină autonom secvența pașilor pe baza calității informațiilor pe care le găsește.

Definirea Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) este un nou paradigm în dezvoltarea AI, unde LLM-urile nu doar extrag informații din surse de date externe, ci și planifică autonom pașii următori. Spre deosebire de modelele statice de tip „retrieval-then-read” sau secvențele de prompturi atent scriptate, Agentic RAG implică o buclă de apeluri iterative către LLM, intercalate cu utilizarea de instrumente sau funcții și producții structurate. La fiecare pas, sistemul evaluează rezultatele obținute, decide dacă să rafineze interogările, invocă instrumente suplimentare dacă este necesar și continuă acest ciclu până când obține o soluție satisfăcătoare.

Acest stil iterativ „maker-checker” este conceput pentru a îmbunătăți corectitudinea, a gestiona interogările defectuoase către baze de date structurate (de exemplu, NL2SQL) și a asigura rezultate echilibrate și de înaltă calitate. În loc să se bazeze exclusiv pe lanțuri de prompturi atent proiectate, sistemul deține activ procesul său de raționament. Poate rescrie interogările care eșuează, alege metode diferite de extragere și integrează multiple instrumente—cum ar fi căutarea vectorială în Azure AI Search, baze de date SQL sau API-uri personalizate—înainte de a finaliza răspunsul. Acest lucru elimină necesitatea unor cadre de orchestrare excesiv de complexe. În schimb, o buclă relativ simplă de „apel LLM → utilizare instrument → apel LLM → …” poate produce rezultate sofisticate și bine fundamentate.

Agentic RAG Core Loop

Deținerea Procesului de Raționament

Calitatea distinctivă care face un sistem „agentic” este capacitatea sa de a deține procesul său de raționament. Implementările tradiționale RAG depind adesea de oameni care predefinesc o cale pentru model: un lanț de gândire care conturează ce să extragă și când. Dar când un sistem este cu adevărat agentic, decide intern cum să abordeze problema. Nu doar execută un script; determină autonom secvența pașilor pe baza calității informațiilor pe care le găsește. De exemplu, dacă i se cere să creeze o strategie de lansare a unui produs, nu se bazează exclusiv pe un prompt care detaliază întregul flux de cercetare și luare de decizii. În schimb, modelul agentic decide independent să:

  1. Extragă rapoarte despre tendințele pieței actuale folosind Bing Web Grounding.
  2. Identifice date relevante despre competitori folosind Azure AI Search.
  3. Coreleze metrici interne istorice de vânzări folosind Azure SQL Database.
  4. Sintetizeze concluziile într-o strategie coerentă orchestrată prin Azure OpenAI Service.
  5. Evalueze strategia pentru lacune sau inconsecvențe, inițiind o altă rundă de extragere dacă este necesar. Toți acești pași—rafinarea interogărilor, alegerea surselor, iterarea până când este „mulțumit” de răspuns—sunt decise de model, nu pre-scriptate de un om.

Bucle Iterative, Integrarea Instrumentelor și Memorie

Tool Integration Architecture

Un sistem agentic se bazează pe un model de interacțiune în buclă:

În timp, acest lucru creează un sentiment de înțelegere evolutivă, permițând modelului să navigheze sarcini complexe, în mai mulți pași, fără a necesita intervenția constantă a unui om sau reformularea promptului.

Gestionarea Modurilor de Eșec și Auto-Corectare

Autonomia Agentic RAG implică, de asemenea, mecanisme robuste de auto-corectare. Când sistemul întâmpină impasuri—cum ar fi extragerea de documente irelevante sau interogări defectuoase—poate:

Această abordare iterativă și dinamică permite modelului să se îmbunătățească continuu, asigurând că nu este doar un sistem „one-shot”, ci unul care învață din greșelile sale în timpul unei sesiuni date.

Self Correction Mechanism

Limitele Autonomiei

În ciuda autonomiei sale în cadrul unei sarcini, Agentic RAG nu este echivalent cu Inteligența Artificială Generală. Capacitățile sale „agentice” sunt limitate la instrumentele, sursele de date și politicile furnizate de dezvoltatorii umani. Nu poate inventa propriile instrumente sau depăși limitele domeniului stabilite. Mai degrabă, excelează în orchestrarea dinamică a resurselor disponibile. Diferențele cheie față de formele mai avansate de AI includ:

  1. Autonomie Specifică Domeniului: Sistemele Agentic RAG sunt concentrate pe atingerea obiectivelor definite de utilizator într-un domeniu cunoscut, utilizând strategii precum rescrierea interogărilor sau selecția instrumentelor pentru a îmbunătăți rezultatele.
  2. Dependent de Infrastructură: Capacitățile sistemului depind de instrumentele și datele integrate de dezvoltatori. Nu poate depăși aceste limite fără intervenție umană.
  3. Respectarea Limitelor de Siguranță: Liniile directoare etice, regulile de conformitate și politicile de afaceri rămân foarte importante. Libertatea agentului este întotdeauna constrânsă de măsuri de siguranță și mecanisme de supraveghere (sperăm?).

Cazuri Practice și Valoare

Agentic RAG excelează în scenarii care necesită rafinare iterativă și precizie:

  1. Mediile Orientate Spre Corectitudine: În verificări de conformitate, analize de reglementare sau cercetare juridică, modelul agentic poate verifica repetat faptele, consulta multiple surse și rescrie interogările până când produce un răspuns temeinic verificat.
  2. Interacțiuni Complexe cu Baze de Date: Când se lucrează cu date structurate unde interogările pot eșua frecvent sau necesită ajustare, sistemul poate rafina autonom interogările folosind Azure SQL sau Microsoft Fabric OneLake, asigurând că extragerea finală se aliniază cu intenția utilizatorului.
  3. Fluxuri de Lucru Extinse: Sesiunile de lungă durată pot evolua pe măsură ce apar informații noi. Agentic RAG poate încorpora continuu date noi, schimbând strategiile pe măsură ce învață mai multe despre spațiul problemei.

Guvernanță, Transparență și Încredere

Pe măsură ce aceste sisteme devin mai autonome în raționamentul lor, guvernanța și transparența sunt cruciale:

A avea instrumente care oferă un record clar al acțiunilor este esențial. Fără ele, depanarea unui proces în mai mulți pași poate fi foarte dificilă. Vedeți exemplul următor de la Literal AI (compania din spatele Chainlit) pentru un Agent run:

AgentRunExample

AgentRunExample2

Concluzie

Agentic RAG reprezintă o evoluție naturală în modul în care sistemele AI gestionează sarcini complexe, intensive în date. Prin adoptarea unui model de interacțiune în buclă, selectarea autonomă a instrumentelor și rafinarea interogărilor până la obținerea unui rezultat de înaltă calitate, sistemul depășește urmărirea statică a prompturilor, devenind un decident mai adaptiv și conștient de context. Deși încă limitat de infrastructurile și liniile directoare etice definite de oameni, aceste capacități agentice permit interacțiuni AI mai bogate, mai dinamice și, în cele din urmă, mai utile pentru întreprinderi și utilizatori finali.

Aveți mai multe întrebări despre Agentic RAG?

Alăturați-vă Azure AI Foundry Discord pentru a întâlni alți cursanți, a participa la ore de birou și a obține răspunsuri la întrebările despre AI Agents.

Resurse

Implementarea Generării Augmentate prin Recuperare (RAG) cu Azure OpenAI Service: Învață cum să folosești propriile date cu Azure OpenAI Service. Acest modul Microsoft Learn oferă un ghid cuprinzător pentru implementarea RAG

Lucrări academice

Lecția anterioară

Modelul de proiectare pentru utilizarea uneltelor

Lecția următoare

Construirea agenților AI de încredere


Declinarea responsabilității:
Acest document a fost tradus utilizând serviciul de traducere AI Co-op Translator. Deși depunem eforturi pentru a asigura acuratețea, vă rugăm să aveți în vedere că traducerile automate pot conține erori sau inexactități. Documentul original în limba sa nativă ar trebui considerat sursa autoritară. Pentru informații critice, se recomandă traducerea profesională realizată de un specialist uman. Nu ne asumăm răspunderea pentru eventualele neînțelegeri sau interpretări greșite care pot apărea din utilizarea acestei traduceri.