
(Faceți clic pe imaginea de mai sus pentru a viziona videoclipul acestei lecții)
Agentic RAG
Această lecție oferă o prezentare cuprinzătoare a Agentic Retrieval-Augmented Generation (Agentic RAG), un nou paradigm AI în care modelele de limbaj mari (LLMs) planifică autonom pașii următori în timp ce extrag informații din surse externe. Spre deosebire de modelele statice de tip „retrieval-then-read”, Agentic RAG implică apeluri iterative către LLM, intercalate cu utilizarea de instrumente sau funcții și producții structurate. Sistemul evaluează rezultatele, rafinează interogările, invocă instrumente suplimentare dacă este necesar și continuă acest ciclu până când se obține o soluție satisfăcătoare.
Introducere
Această lecție va acoperi:
- Înțelegerea Agentic RAG: Aflați despre noul paradigm în AI, unde modelele de limbaj mari (LLMs) planifică autonom pașii următori în timp ce extrag informații din surse de date externe.
- Stil Iterativ Maker-Checker: Înțelegeți bucla apelurilor iterative către LLM, intercalate cu utilizarea de instrumente sau funcții și producții structurate, concepute pentru a îmbunătăți corectitudinea și a gestiona interogările defectuoase.
- Explorarea Aplicațiilor Practice: Identificați scenarii în care Agentic RAG excelează, cum ar fi medii orientate spre corectitudine, interacțiuni complexe cu baze de date și fluxuri de lucru extinse.
Obiective de Învățare
După finalizarea acestei lecții, veți ști cum să/veți înțelege:
- Înțelegerea Agentic RAG: Aflați despre noul paradigm în AI, unde modelele de limbaj mari (LLMs) planifică autonom pașii următori în timp ce extrag informații din surse de date externe.
- Stil Iterativ Maker-Checker: Înțelegeți conceptul unei bucle de apeluri iterative către LLM, intercalate cu utilizarea de instrumente sau funcții și producții structurate, concepute pentru a îmbunătăți corectitudinea și a gestiona interogările defectuoase.
- Deținerea Procesului de Raționament: Înțelegeți capacitatea sistemului de a deține procesul său de raționament, luând decizii despre cum să abordeze problemele fără a se baza pe căi predefinite.
- Flux de Lucru: Înțelegeți cum un model agentic decide independent să extragă rapoarte despre tendințele pieței, să identifice date despre competitori, să coreleze metrici interne de vânzări, să sintetizeze concluziile și să evalueze strategia.
- Bucle Iterative, Integrarea Instrumentelor și Memorie: Aflați despre dependența sistemului de un model de interacțiune în buclă, menținând starea și memoria între pași pentru a evita buclele repetitive și a lua decizii informate.
- Gestionarea Modurilor de Eșec și Auto-Corectare: Explorați mecanismele robuste de auto-corectare ale sistemului, inclusiv iterarea și reinterogarea, utilizarea instrumentelor de diagnostic și revenirea la supravegherea umană.
- Limitele Autonomiei: Înțelegeți limitările Agentic RAG, concentrându-vă pe autonomia specifică domeniului, dependența de infrastructură și respectarea limitelor de siguranță.
- Cazuri Practice și Valoare: Identificați scenarii în care Agentic RAG excelează, cum ar fi medii orientate spre corectitudine, interacțiuni complexe cu baze de date și fluxuri de lucru extinse.
- Guvernanță, Transparență și Încredere: Aflați despre importanța guvernanței și transparenței, inclusiv raționamentul explicabil, controlul prejudecăților și supravegherea umană.
Ce este Agentic RAG?
Agentic Retrieval-Augmented Generation (Agentic RAG) este un nou paradigm AI în care modelele de limbaj mari (LLMs) planifică autonom pașii următori în timp ce extrag informații din surse externe. Spre deosebire de modelele statice de tip „retrieval-then-read”, Agentic RAG implică apeluri iterative către LLM, intercalate cu utilizarea de instrumente sau funcții și producții structurate. Sistemul evaluează rezultatele, rafinează interogările, invocă instrumente suplimentare dacă este necesar și continuă acest ciclu până când se obține o soluție satisfăcătoare. Acest stil iterativ „maker-checker” îmbunătățește corectitudinea, gestionează interogările defectuoase și asigură rezultate de înaltă calitate.
Sistemul deține activ procesul său de raționament, rescriind interogările eșuate, alegând metode diferite de extragere și integrând multiple instrumente—cum ar fi căutarea vectorială în Azure AI Search, baze de date SQL sau API-uri personalizate—înainte de a finaliza răspunsul. Calitatea distinctivă a unui sistem agentic este capacitatea sa de a deține procesul său de raționament. Implementările tradiționale RAG se bazează pe căi predefinite, dar un sistem agentic determină autonom secvența pașilor pe baza calității informațiilor pe care le găsește.
Definirea Agentic Retrieval-Augmented Generation (Agentic RAG)
Agentic Retrieval-Augmented Generation (Agentic RAG) este un nou paradigm în dezvoltarea AI, unde LLM-urile nu doar extrag informații din surse de date externe, ci și planifică autonom pașii următori. Spre deosebire de modelele statice de tip „retrieval-then-read” sau secvențele de prompturi atent scriptate, Agentic RAG implică o buclă de apeluri iterative către LLM, intercalate cu utilizarea de instrumente sau funcții și producții structurate. La fiecare pas, sistemul evaluează rezultatele obținute, decide dacă să rafineze interogările, invocă instrumente suplimentare dacă este necesar și continuă acest ciclu până când obține o soluție satisfăcătoare.
Acest stil iterativ „maker-checker” este conceput pentru a îmbunătăți corectitudinea, a gestiona interogările defectuoase către baze de date structurate (de exemplu, NL2SQL) și a asigura rezultate echilibrate și de înaltă calitate. În loc să se bazeze exclusiv pe lanțuri de prompturi atent proiectate, sistemul deține activ procesul său de raționament. Poate rescrie interogările care eșuează, alege metode diferite de extragere și integrează multiple instrumente—cum ar fi căutarea vectorială în Azure AI Search, baze de date SQL sau API-uri personalizate—înainte de a finaliza răspunsul. Acest lucru elimină necesitatea unor cadre de orchestrare excesiv de complexe. În schimb, o buclă relativ simplă de „apel LLM → utilizare instrument → apel LLM → …” poate produce rezultate sofisticate și bine fundamentate.

Deținerea Procesului de Raționament
Calitatea distinctivă care face un sistem „agentic” este capacitatea sa de a deține procesul său de raționament. Implementările tradiționale RAG depind adesea de oameni care predefinesc o cale pentru model: un lanț de gândire care conturează ce să extragă și când.
Dar când un sistem este cu adevărat agentic, decide intern cum să abordeze problema. Nu doar execută un script; determină autonom secvența pașilor pe baza calității informațiilor pe care le găsește.
De exemplu, dacă i se cere să creeze o strategie de lansare a unui produs, nu se bazează exclusiv pe un prompt care detaliază întregul flux de cercetare și luare de decizii. În schimb, modelul agentic decide independent să:
- Extragă rapoarte despre tendințele pieței actuale folosind Bing Web Grounding.
- Identifice date relevante despre competitori folosind Azure AI Search.
- Coreleze metrici interne istorice de vânzări folosind Azure SQL Database.
- Sintetizeze concluziile într-o strategie coerentă orchestrată prin Azure OpenAI Service.
- Evalueze strategia pentru lacune sau inconsecvențe, inițiind o altă rundă de extragere dacă este necesar.
Toți acești pași—rafinarea interogărilor, alegerea surselor, iterarea până când este „mulțumit” de răspuns—sunt decise de model, nu pre-scriptate de un om.
Bucle Iterative, Integrarea Instrumentelor și Memorie

Un sistem agentic se bazează pe un model de interacțiune în buclă:
- Apel Inițial: Obiectivul utilizatorului (aka. promptul utilizatorului) este prezentat LLM-ului.
- Invocarea Instrumentelor: Dacă modelul identifică informații lipsă sau instrucțiuni ambigue, selectează un instrument sau o metodă de extragere—cum ar fi o interogare într-o bază de date vectorială (de exemplu, Azure AI Search Hybrid search peste date private) sau un apel SQL structurat—pentru a aduna mai mult context.
- Evaluare și Rafinare: După revizuirea datelor returnate, modelul decide dacă informațiile sunt suficiente. Dacă nu, rafinează interogarea, încearcă un instrument diferit sau își ajustează abordarea.
- Repetare Până la Satisfacție: Acest ciclu continuă până când modelul determină că are suficientă claritate și dovezi pentru a oferi un răspuns final bine fundamentat.
- Memorie și Stare: Deoarece sistemul menține starea și memoria între pași, poate reaminti încercările anterioare și rezultatele acestora, evitând buclele repetitive și luând decizii mai informate pe măsură ce progresează.
În timp, acest lucru creează un sentiment de înțelegere evolutivă, permițând modelului să navigheze sarcini complexe, în mai mulți pași, fără a necesita intervenția constantă a unui om sau reformularea promptului.
Gestionarea Modurilor de Eșec și Auto-Corectare
Autonomia Agentic RAG implică, de asemenea, mecanisme robuste de auto-corectare. Când sistemul întâmpină impasuri—cum ar fi extragerea de documente irelevante sau interogări defectuoase—poate:
- Itera și Reinteroga: În loc să returneze răspunsuri de valoare scăzută, modelul încearcă noi strategii de căutare, rescrie interogări către baze de date sau analizează seturi de date alternative.
- Utiliza Instrumente de Diagnostic: Sistemul poate invoca funcții suplimentare concepute pentru a-l ajuta să depaneze pașii de raționament sau să confirme corectitudinea datelor extrase. Instrumente precum Azure AI Tracing vor fi importante pentru a permite observabilitate și monitorizare robuste.
- Reveni la Supravegherea Umană: Pentru scenarii cu miză mare sau eșecuri repetate, modelul poate semnala incertitudinea și solicita îndrumare umană. Odată ce omul oferă feedback corectiv, modelul poate încorpora acea lecție pe viitor.
Această abordare iterativă și dinamică permite modelului să se îmbunătățească continuu, asigurând că nu este doar un sistem „one-shot”, ci unul care învață din greșelile sale în timpul unei sesiuni date.

Limitele Autonomiei
În ciuda autonomiei sale în cadrul unei sarcini, Agentic RAG nu este echivalent cu Inteligența Artificială Generală. Capacitățile sale „agentice” sunt limitate la instrumentele, sursele de date și politicile furnizate de dezvoltatorii umani. Nu poate inventa propriile instrumente sau depăși limitele domeniului stabilite. Mai degrabă, excelează în orchestrarea dinamică a resurselor disponibile.
Diferențele cheie față de formele mai avansate de AI includ:
- Autonomie Specifică Domeniului: Sistemele Agentic RAG sunt concentrate pe atingerea obiectivelor definite de utilizator într-un domeniu cunoscut, utilizând strategii precum rescrierea interogărilor sau selecția instrumentelor pentru a îmbunătăți rezultatele.
- Dependent de Infrastructură: Capacitățile sistemului depind de instrumentele și datele integrate de dezvoltatori. Nu poate depăși aceste limite fără intervenție umană.
- Respectarea Limitelor de Siguranță: Liniile directoare etice, regulile de conformitate și politicile de afaceri rămân foarte importante. Libertatea agentului este întotdeauna constrânsă de măsuri de siguranță și mecanisme de supraveghere (sperăm?).
Cazuri Practice și Valoare
Agentic RAG excelează în scenarii care necesită rafinare iterativă și precizie:
- Mediile Orientate Spre Corectitudine: În verificări de conformitate, analize de reglementare sau cercetare juridică, modelul agentic poate verifica repetat faptele, consulta multiple surse și rescrie interogările până când produce un răspuns temeinic verificat.
- Interacțiuni Complexe cu Baze de Date: Când se lucrează cu date structurate unde interogările pot eșua frecvent sau necesită ajustare, sistemul poate rafina autonom interogările folosind Azure SQL sau Microsoft Fabric OneLake, asigurând că extragerea finală se aliniază cu intenția utilizatorului.
- Fluxuri de Lucru Extinse: Sesiunile de lungă durată pot evolua pe măsură ce apar informații noi. Agentic RAG poate încorpora continuu date noi, schimbând strategiile pe măsură ce învață mai multe despre spațiul problemei.
Guvernanță, Transparență și Încredere
Pe măsură ce aceste sisteme devin mai autonome în raționamentul lor, guvernanța și transparența sunt cruciale:
- Raționament Explicabil: Modelul poate oferi o urmă de audit a interogărilor pe care le-a făcut, sursele pe care le-a consultat și pașii de raționament pe care i-a urmat pentru a ajunge la concluzia sa. Instrumente precum Azure AI Content Safety și Azure AI Tracing / GenAIOps pot ajuta la menținerea transparenței și la reducerea riscurilor.
- Controlul Prejudecăților și Extragerea Echilibrată: Dezvoltatorii pot ajusta strategiile de extragere pentru a se asigura că sunt luate în considerare surse de date echilibrate și reprezentative și pot audita regulat rezultatele pentru a detecta prejudecăți sau modele distorsionate folosind modele personalizate pentru organizații avansate de știința datelor utilizând Azure Machine Learning.
- Supravegherea Umană și Conformitatea: Pentru sarcini sensibile, revizuirea umană rămâne esențială. Agentic RAG nu înlocuiește judecata umană în deciziile cu miză mare—o completează prin oferirea de opțiuni mai temeinic verificate.
A avea instrumente care oferă un record clar al acțiunilor este esențial. Fără ele, depanarea unui proces în mai mulți pași poate fi foarte dificilă. Vedeți exemplul următor de la Literal AI (compania din spatele Chainlit) pentru un Agent run:


Concluzie
Agentic RAG reprezintă o evoluție naturală în modul în care sistemele AI gestionează sarcini complexe, intensive în date. Prin adoptarea unui model de interacțiune în buclă, selectarea autonomă a instrumentelor și rafinarea interogărilor până la obținerea unui rezultat de înaltă calitate, sistemul depășește urmărirea statică a prompturilor, devenind un decident mai adaptiv și conștient de context. Deși încă limitat de infrastructurile și liniile directoare etice definite de oameni, aceste capacități agentice permit interacțiuni AI mai bogate, mai dinamice și, în cele din urmă, mai utile pentru întreprinderi și utilizatori finali.
Aveți mai multe întrebări despre Agentic RAG?
Alăturați-vă Azure AI Foundry Discord pentru a întâlni alți cursanți, a participa la ore de birou și a obține răspunsuri la întrebările despre AI Agents.
Resurse
Implementarea Generării Augmentate prin Recuperare (RAG) cu Azure OpenAI Service: Învață cum să folosești propriile date cu Azure OpenAI Service. Acest modul Microsoft Learn oferă un ghid cuprinzător pentru implementarea RAG
Lucrări academice
Lecția anterioară
Modelul de proiectare pentru utilizarea uneltelor
Lecția următoare
Construirea agenților AI de încredere
Declinarea responsabilității:
Acest document a fost tradus utilizând serviciul de traducere AI Co-op Translator. Deși depunem eforturi pentru a asigura acuratețea, vă rugăm să aveți în vedere că traducerile automate pot conține erori sau inexactități. Documentul original în limba sa nativă ar trebui considerat sursa autoritară. Pentru informații critice, se recomandă traducerea profesională realizată de un specialist uman. Nu ne asumăm răspunderea pentru eventualele neînțelegeri sau interpretări greșite care pot apărea din utilizarea acestei traduceri.