ai-agents-for-beginners

Agentic RAG

(Klikka ülaloleval pildil, et vaadata selle õppetunni videot)

Agentic RAG

See õppetund annab põhjaliku ülevaate Agentic Retrieval-Augmented Generationist (Agentic RAG), uuest tehisintellekti paradigmast, kus suured keelemudelid (LLMid) planeerivad iseseisvalt oma järgmisi samme, samal ajal kui nad tõmbavad teavet välisallikatest. Erinevalt staatilistest päringupõhistest mustritest hõlmab Agentic RAG iteratiivseid LLM-kõnesid, vaheldumisi tööriista- või funktsiooniüleskutsete ning struktureeritud väljunditega. Süsteem hindab tulemusi, täpsustab päringuid, kutsub vajadusel täiendavaid tööriistu ning jätkab seda tsüklit, kuni saavutatakse rahuldav lahendus.

Introduction

See õppetund käsitleb

Learning Goals

Pärast selle õppetunni läbimist tead/saavutad:

What is Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) on uus AI-paradigm, kus suured keelemudelid (LLMid) mitte ainult ei tõmba andmeid välisallikatest, vaid planeerivad ka iseseisvalt järgmisi samme. Erinevalt staatilistest „päringu-then-lugemine“ mustritest või hoolikalt skriptitud prompt-sektsioonidest hõlmab Agentic RAG iteratiivset LLM-kõnede tsüklit, mis vaheldub tööriista- või funktsiooniüleskutsete ning struktureeritud väljunditega. Igal sammul hindab süsteem saadud tulemusi, otsustab, kas täpsustada päringuid, kutsub vajadusel täiendavaid tööriistu ja jätkab seda protsessi, kuni saavutatakse rahuldav lahendus.

See iteratiivne „maker-checker“ tööstiil on loodud korrektuse parandamiseks, struktureeritud andmebaaside (nt NL2SQL) valesti vormistatud päringute käsitlemiseks ning tasakaalustatud, kvaliteetsete tulemuste tagamiseks. Selle asemel, et tugineda üksnes hoolikalt välja töötatud prompt-ahelatele, omab süsteem aktiivselt oma põhjendusprotsessi. See võib ümber kirjutada ebaõnnestunud päringuid, valida erinevaid päringumeetodeid ja integreerida mitmeid tööriistu—näiteks vektorotsing Azure AI Searchis, SQL-andmebaasid või kohandatud API-d—enne lõpliku vastuse andmist. See eemaldab vajaduse ülekomplekseeritud orkestreerimisraamistike järele. Selle asemel võib suhteliselt lihtne tsükkel „LLM call → tool use → LLM call → …“ toota keerukaid ja hästi põhjendatud väljundeid.

Agentic RAG Core Loop

Owning the Reasoning Process

Erinevus, mis muudab süsteemi „agentseks“, on selle võime omada oma põhjendusprotsessi. Traditsioonilised RAG-implementatsioonid tuginevad sageli inimeste poolt eelnevalt määratletud teekonnale: mõttekäiguahelale, mis määratleb, mida ja millal pärida. Aga kui süsteem on tõeliselt agentne, otsustab see sisemiselt, kuidas probleemi läheneda. See ei täida lihtsalt skripti; see määrab autonoomselt sammude järjekorra vastavalt leiutud info kvaliteedile. Näiteks, kui temalt küsitakse tootega turuletoomise strateegia loomist, ei tugine see üksnes promptile, mis kirjeldab kogu uurimis- ja otsustusprotsessi. Selle asemel otsustab agentne mudel iseseisvalt:

  1. Retrieve current market trend reports using Bing Web Grounding
  2. Identify relevant competitor data using Azure AI Search.
  3. Correlate historical internal sales metrics using Azure SQL Database.
  4. Synthesize the findings into a cohesive strategy orchestrated via Azure OpenAI Service.
  5. Evaluate the strategy for gaps or inconsistencies, prompting another round of retrieval if necessary. Kõik need sammud—päringute täpsustamine, allikate valimine, iteratsioon kuni vastuse „rahuloluni“—otsustab mudel, mitte inimene, kes seda ette skriptis.

Iterative Loops, Tool Integration, and Memory

Tool Integration Architecture

Agentne süsteem tugineb silmusepõhisele interaktsioonimustrile:

Aja jooksul loob see areneva arusaamise tunde, võimaldades mudelil navigeerida keerukate, mitmeastmeliste ülesannete läbi ilma, et inimene peaks pidevalt sekkuma või prompti ümber kujundama.

Handling Failure Modes and Self-Correction

Agentic RAG autonoomia hõlmab ka tugevaid enesekorrektsiooni mehhanisme. Kui süsteem satub ummikseisu—näiteks tõmbab ebaolulisi dokumente või kohtub valesti vormistatud päringutega—siis ta võib:

See iteratiivne ja dünaamiline lähenemine võimaldab mudelil pidevalt paraneda, tagades, et see pole lihtsalt ühekordne süsteem, vaid õpib antud seansi jooksul tehtud eksimustest.

Self Correction Mechanism

Boundaries of Agency

Vaatamata autonoomiale ülesande piires ei ole Agentic RAG sarnane üldintellektiga (Artificial General Intelligence). Selle „agentne“ suutlikkus piirneb inimarendajate poolt pakutavate tööriistade, andmeallikate ja poliitikatega. See ei saa välja mõelda oma tööriistu ega astuda väljapoole määratletud domeenipiire. Selle asemel on ta tugev olemasolevate ressursside dünaamilisel orkestreerimisel. Peamised erinevused võrreldes arenenumate AI-vormidega hõlmavad:

  1. Domain-Specific Autonomy: Agentic RAG süsteemid keskenduvad kasutaja määratletud eesmärkide saavutamisele teadaolevas domeenis, kasutades strateegiaid nagu päringu ümberkirjutamine või tööriista valik tulemuste parandamiseks.
  2. Infrastructure-Dependent: Süsteemi võimekus sõltub arendajate integreeritud tööriistadest ja andmetest. See ei saa neid piire ületada ilma inimsekkumiseta.
  3. Respect for Guardrails: Eetilised juhised, vastavusreeglid ja äripoliitikad jäävad väga oluliseks. Agendi vabadus on alati piiratud turvameetmete ja järelevalvega (loodetavasti?)

Practical Use Cases and Value

Agentic RAG paistab silma olukordades, mis nõuavad iteratiivset täpsustamist ja täpsust:

  1. Correctness-First Environments: Vastavuskontrollide, regulatiivsete analüüside või õigusuurimuste puhul saab agentne mudel korduvalt faktilisi väiteid kontrollida, konsulteerida mitme allikaga ja ümber kirjutada päringuid, kuni ta toodab põhjalikult kontrollitud vastuse.
  2. Complex Database Interactions: Töötades struktureeritud andmetega, kus päringud võivad sageli ebaõnnestuda või vajada kohandamist, saab süsteem iseseisvalt täpsustada päringuid, kasutades Azure SQLi või Microsoft Fabric OneLake’i, tagamaks, et lõplik päring vastab kasutaja kavatsusele.
  3. Extended Workflows: Pikemaajalised sessioonid võivad areneda, kui ilmneb uut infot. Agentic RAG suudab pidevalt integreerida uusi andmeid ja muuta strateegiaid, kui ta probleemi kohta rohkem teada saab.

Governance, Transparency, and Trust

Nende süsteemide muutudes mõistuspärasemaks oma põhjenduses on haldus ja läbipaistvus olulised:

Oluline on omada tööriistu, mis pakuvad tegevuste selget kirjet. Ilma nendeta võib mitmeastmelise protsessi silumine olla väga raske. Vaata järgmist näidet ettevõttelt Literal AI (Chainliti taga olev ettevõte) Agent-runist:

AgentRunExample

Conclusion

Agentic RAG esindab loomulikku evolutsiooni selles, kuidas AI-süsteemid käsitlevad keerukaid ja andmerohkeid ülesandeid. Võttes kasutusele silmusepõhise interaktsioonimustri, valides autonoomselt tööriistu ja täpsustades päringuid kuni kõrgekvaliteedilise tulemuse saavutamiseni, liigub süsteem edasi staatilisest prompti järgimisest kohanduvama ja kontekstiteadlikuma otsustajani. Kuigi see on endiselt inimmääratletud infrastruktuuri ja eetiliste juhiste piiratud, võimaldavad need agentse võimekuse kujunemised rikkalikumaid, dünaamilisemaid ja lõppkokkuvõttes kasulikumaid AI-interaktsioone nii ettevõtetele kui ka lõppkasutajatele.

Got More Questions about Agentic RAG?

Liitu Microsoft Foundry Discord, et kohtuda teiste õppuritega, osaleda „office hours“ sessioonidel ja saada vastuseid oma AI Agents küsimustele.

Additional Resources

Akadeemilised artiklid

Eelmine õppetund

Tööriista kasutamise disainimuster

Järgmine õppetund

Usaldusväärsete tehisintellekti agentide loomine


Lahtiütlus: See dokument on tõlgitud tehisintellekti tõlketeenuse Co-op Translator (https://github.com/Azure/co-op-translator) abil. Kuigi me püüdleme täpsuse poole, palun arvestage, et automatiseeritud tõlked võivad sisaldada vigu või ebatäpsusi. Algset dokumenti selle algkeeles tuleks pidada autoriteetseks allikaks. Olulise teabe puhul soovitatakse kasutada professionaalset inimtõlget. Me ei vastuta selle tõlke kasutamisest tulenevate arusaamatuste ega väärtõlgenduste eest.