ai-agents-for-beginners

Agentic RAG

(Click pe imaginea de mai sus pentru a viziona videoclipul acestei lecții)

Agentic RAG

Această lecție oferă o prezentare cuprinzătoare a paradigmei emergente Agentic Retrieval-Augmented Generation (Agentic RAG), unde modelele lingvistice mari (LLMs) planifică autonom pașii următori în timp ce extrag informații din surse externe. Spre deosebire de modelele statice de tip „retrieval-then-read”, Agentic RAG implică apeluri iterative către LLM, intercalate cu utilizarea de instrumente sau funcții și producerea de rezultate structurate. Sistemul evaluează rezultatele, rafinează interogările, invocă instrumente suplimentare dacă este necesar și continuă acest ciclu până când se obține o soluție satisfăcătoare.

Introducere

Această lecție va acoperi:

Obiective de învățare

După finalizarea acestei lecții, vei ști cum să/vei înțelege:

Ce este Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) este o paradigmă emergentă în AI, unde modelele lingvistice mari (LLMs) planifică autonom pașii următori în timp ce extrag informații din surse externe. Spre deosebire de modelele statice de tip „retrieval-then-read”, Agentic RAG implică apeluri iterative către LLM, intercalate cu utilizarea de instrumente sau funcții și producerea de rezultate structurate. Sistemul evaluează rezultatele, rafinează interogările, invocă instrumente suplimentare dacă este necesar și continuă acest ciclu până când se obține o soluție satisfăcătoare. Acest stil iterativ „maker-checker” îmbunătățește corectitudinea, gestionează interogările defectuoase și asigură rezultate de înaltă calitate.

Sistemul își asumă activ procesul de raționare, rescriind interogările eșuate, alegând metode de extragere diferite și integrând multiple instrumente—cum ar fi căutarea vectorială în Azure AI Search, baze de date SQL sau API-uri personalizate—înainte de a finaliza răspunsul. Calitatea distinctivă a unui sistem agentic este capacitatea sa de a deține procesul de raționare. Implementările tradiționale RAG se bazează pe căi predefinite, dar un sistem agentic determină autonom secvența pașilor pe baza calității informațiilor pe care le găsește.

Definirea Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) este o paradigmă emergentă în dezvoltarea AI, unde LLM-urile nu doar extrag informații din surse de date externe, ci și planifică autonom pașii următori. Spre deosebire de modelele statice de tip „retrieval-then-read” sau secvențele de prompturi atent scriptate, Agentic RAG implică o buclă de apeluri iterative către LLM, intercalate cu utilizarea de instrumente sau funcții și producerea de rezultate structurate. La fiecare pas, sistemul evaluează rezultatele obținute, decide dacă să rafineze interogările, invocă instrumente suplimentare dacă este necesar și continuă acest ciclu până când obține o soluție satisfăcătoare.

Acest stil iterativ „maker-checker” este conceput pentru a îmbunătăți corectitudinea, a gestiona interogările defectuoase către baze de date structurate (de exemplu, NL2SQL) și a asigura rezultate echilibrate și de înaltă calitate. În loc să se bazeze exclusiv pe lanțuri de prompturi atent proiectate, sistemul își asumă activ procesul de raționare. Poate rescrie interogările care eșuează, alege metode de extragere diferite și integrează multiple instrumente—cum ar fi căutarea vectorială în Azure AI Search, baze de date SQL sau API-uri personalizate—înainte de a finaliza răspunsul. Acest lucru elimină necesitatea unor cadre de orchestrare excesiv de complexe. În schimb, o buclă relativ simplă de „apel LLM → utilizare instrument → apel LLM → …” poate produce rezultate sofisticate și bine fundamentate.

Agentic RAG Core Loop

Deținerea procesului de raționare

Calitatea distinctivă care face un sistem „agentic” este capacitatea sa de a deține procesul de raționare. Implementările tradiționale RAG se bazează adesea pe oameni care predefinesc o cale pentru model: un lanț de gândire care indică ce să extragă și când. Dar când un sistem este cu adevărat agentic, decide intern cum să abordeze problema. Nu execută doar un script; determină autonom secvența pașilor pe baza calității informațiilor pe care le găsește. De exemplu, dacă i se cere să creeze o strategie de lansare a unui produs, nu se bazează doar pe un prompt care detaliază întregul flux de cercetare și luare de decizii. În schimb, modelul agentic decide independent să:

  1. Extragă rapoarte despre tendințele actuale ale pieței folosind Bing Web Grounding.
  2. Identifice date relevante despre competitori folosind Azure AI Search.
  3. Coreleze metrici istorice interne de vânzări folosind Azure SQL Database.
  4. Sintetizeze concluziile într-o strategie coerentă orchestrată prin Azure OpenAI Service.
  5. Evalueze strategia pentru lacune sau inconsecvențe, inițiind o altă rundă de extragere dacă este necesar.

Toți acești pași—rafinarea interogărilor, alegerea surselor, iterarea până când este „mulțumit” de răspuns—sunt decise de model, nu pre-scriptate de un om.

Bucle iterative, integrarea instrumentelor și memorie

Tool Integration Architecture

Un sistem agentic se bazează pe un model de interacțiune în buclă:

În timp, acest lucru creează un sentiment de înțelegere evolutivă, permițând modelului să navigheze prin sarcini complexe, în mai mulți pași, fără a necesita intervenția constantă a unui om sau reformularea promptului.

Gestionarea modurilor de eșec și autocorecția

Autonomia Agentic RAG implică, de asemenea, mecanisme robuste de autocorecție. Când sistemul întâmpină blocaje—cum ar fi extragerea de documente irelevante sau interogări defectuoase—poate:

Această abordare iterativă și dinamică permite modelului să se îmbunătățească continuu, asigurând că nu este doar un sistem „one-shot”, ci unul care învață din greșelile sale în timpul unei sesiuni date.

Self Correction Mechanism

Limitele autonomiei

În ciuda autonomiei sale în cadrul unei sarcini, Agentic RAG nu este echivalent cu Inteligența Generală Artificială. Capacitățile sale „agentice” sunt limitate la instrumentele, sursele de date și politicile furnizate de dezvoltatorii umani. Nu poate inventa propriile instrumente sau depăși limitele domeniului stabilite. Mai degrabă, excelează în orchestrarea dinamică a resurselor disponibile.

Diferențele cheie față de formele mai avansate de AI includ:

  1. Autonomie specifică domeniului: Sistemele Agentic RAG sunt concentrate pe atingerea obiectivelor definite de utilizator într-un domeniu cunoscut, utilizând strategii precum rescrierea interogărilor sau selectarea instrumentelor pentru a îmbunătăți rezultatele.
  2. Dependent de infrastructură: Capacitățile sistemului depind de instrumentele și datele integrate de dezvoltatori. Nu poate depăși aceste limite fără intervenție umană.
  3. Respectarea măsurilor de siguranță: Liniile directoare etice, regulile de conformitate și politicile de afaceri rămân foarte importante. Libertatea agentului este întotdeauna constrânsă de măsuri de siguranță și mecanisme de supraveghere (sperăm?).

Cazuri de utilizare practică și valoare

Agentic RAG excelează în scenarii care necesită rafinare iterativă și precizie:

  1. Mediile orientate spre corectitudine: În verificări de conformitate, analize de reglementare sau cercetare juridică, modelul agentic poate verifica repetat faptele, consulta surse multiple și rescrie interogările până când produce un răspuns temeinic verificat.
  2. Interacțiuni complexe cu baze de date: Când se lucrează cu date structurate, unde interogările pot eșua frecvent sau necesita ajustări, sistemul poate rafina autonom interogările folosind Azure SQL sau Microsoft Fabric OneLake, asigurând că extragerea finală se aliniază cu intenția utilizatorului.
  3. Fluxuri de lucru extinse: Sesiunile de lungă durată pot evolua pe măsură ce apar informații noi. Agentic RAG poate încorpora continuu date noi, schimbând strategiile pe măsură ce învață mai multe despre spațiul problemei.

Guvernanță, transparență și încredere

Pe măsură ce aceste sisteme devin mai autonome în raționamentul lor, guvernanța și transparența sunt esențiale:

A avea instrumente care oferă un record clar al acțiunilor este esențial. Fără ele, depanarea unui proces în mai mulți pași poate fi foarte dificilă. Vezi exemplul următor de la Literal AI (compania din spatele Chainlit) pentru un Agent run:

AgentRunExample

Concluzie

Agentic RAG reprezintă o evoluție naturală în modul în care sistemele AI gestionează sarcini complexe, intensive în date. Prin adoptarea unui model de interacțiune în buclă, selectarea autonomă a instrumentelor și rafinarea interogărilor până la obținerea unui rezultat de înaltă calitate, sistemul depășește urmărirea statică a prompturilor, devenind un decident mai adaptiv și conștient de context. Deși încă limitate de infrastructurile definite de oameni și liniile directoare etice, aceste capacități agentice permit interacțiuni AI mai bogate, mai dinamice și, în cele din urmă, mai utile pentru întreprinderi și utilizatori finali.

Ai mai multe întrebări despre Agentic RAG?

Alătură-te Azure AI Foundry Discord pentru a întâlni alți cursanți, a participa la ore de consultanță și a obține răspunsuri la întrebările tale despre AI Agents.

Resurse suplimentare

Lucrări academice

Lecția anterioară

Modelul de utilizare a instrumentelor

Lecția următoare

Construirea agenților AI de încredere


Declinare de responsabilitate:
Acest document a fost tradus folosind serviciul de traducere AI Co-op Translator. Deși ne străduim să asigurăm acuratețea, vă rugăm să fiți conștienți că traducerile automate pot conține erori sau inexactități. Documentul original în limba sa natală ar trebui considerat sursa autoritară. Pentru informații critice, se recomandă traducerea profesională realizată de un specialist. Nu ne asumăm responsabilitatea pentru eventualele neînțelegeri sau interpretări greșite care pot apărea din utilizarea acestei traduceri.