ai-agents-for-beginners

Agentic RAG

(Klõpsa ülaloleval pildil, et vaadata selle õppetunni videot)

Agentic RAG

See õppetund annab põhjaliku ülevaate Agentic Retrieval-Augmented Generation (Agentic RAG) kontseptsioonist, mis on uus AI paradigma, kus suured keelemudelid (LLM-id) planeerivad autonoomselt oma järgmisi samme, samal ajal hankides teavet välistest allikatest. Erinevalt staatilisest “otsing-ja-lugemine” mustrist hõlmab Agentic RAG korduvaid LLM-i päringuid, mille vahele on põimitud tööriista või funktsiooni kasutamine ja struktureeritud väljundid. Süsteem hindab tulemusi, täpsustab päringuid, kutsub vajadusel esile täiendavaid tööriistu ja jätkab seda tsüklit, kuni saavutatakse rahuldav lahendus.

Sissejuhatus

Selles õppetunnis käsitletakse:

Õppeeesmärgid

Pärast selle õppetunni läbimist oskad/mõistad:

Mis on Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) on uus AI paradigma, kus suured keelemudelid (LLM-id) planeerivad autonoomselt oma järgmisi samme, samal ajal hankides teavet välisallikatest. Erinevalt staatilisest “otsing-ja-lugemine” mustrist hõlmab Agentic RAG korduvaid LLM-i päringuid, mille vahele on põimitud tööriista või funktsiooni kasutamine ja struktureeritud väljundid. Süsteem hindab tulemusi, täpsustab päringuid, kutsub vajadusel esile täiendavaid tööriistu ja jätkab seda tsüklit, kuni saavutatakse rahuldav lahendus. See iteratiivne “maker-checker” stiil parandab täpsust, käsitleb vigaseid päringuid ja tagab kvaliteetsed tulemused.

Süsteem omab aktiivselt oma mõtlemisprotsessi, kirjutades ümber ebaõnnestunud päringuid, valides erinevaid otsingumeetodeid ja integreerides mitmeid tööriistu—näiteks vektoriotsing Azure AI Searchis, SQL-andmebaasid või kohandatud API-d—enne lõpliku vastuse andmist. Agentliku süsteemi eristav omadus on selle võime omada oma mõtlemisprotsessi. Traditsioonilised RAG-i rakendused tuginevad eelnevalt määratletud teekondadele, kuid agentlik süsteem määrab autonoomselt sammude järjekorra, lähtudes leitud teabe kvaliteedist.

Agentic Retrieval-Augmented Generation (Agentic RAG) määratlemine

Agentic Retrieval-Augmented Generation (Agentic RAG) on AI arenduse uus paradigma, kus LLM-id mitte ainult ei hanka teavet välisandmeallikatest, vaid planeerivad ka autonoomselt oma järgmisi samme. Erinevalt staatilisest “otsing-ja-lugemine” mustrist või hoolikalt skriptitud päringujadadest hõlmab Agentic RAG korduvaid LLM-i päringuid, mille vahele on põimitud tööriista või funktsiooni kasutamine ja struktureeritud väljundid. Iga sammu juures hindab süsteem saadud tulemusi, otsustab, kas päringuid täpsustada, kutsub vajadusel esile täiendavaid tööriistu ja jätkab seda tsüklit, kuni saavutatakse rahuldav lahendus.

See iteratiivne “maker-checker” stiil on loodud täpsuse parandamiseks, vigaste päringute käsitlemiseks struktureeritud andmebaasides (nt NL2SQL) ja tasakaalustatud, kvaliteetsete tulemuste tagamiseks. Selle asemel, et tugineda ainult hoolikalt kavandatud päringujadadele, omab süsteem aktiivselt oma mõtlemisprotsessi. See võib ümber kirjutada ebaõnnestunud päringuid, valida erinevaid otsingumeetodeid ja integreerida mitmeid tööriistu—näiteks vektoriotsing Azure AI Searchis, SQL-andmebaasid või kohandatud API-d—enne lõpliku vastuse andmist. See eemaldab vajaduse ülemäära keerukate orkestreerimisraamistike järele. Selle asemel võib suhteliselt lihtne tsükkel “LLM-i päring → tööriista kasutamine → LLM-i päring → …” anda keerukaid ja hästi põhjendatud väljundeid.

Agentic RAG Core Loop

Mõtlemisprotsessi omamine

Agentliku süsteemi eristav omadus on selle võime omada oma mõtlemisprotsessi. Traditsioonilised RAG-i rakendused sõltuvad sageli inimestest, kes määratlevad mudeli jaoks teekonna: mõttekäigu, mis määrab, mida ja millal otsida. Kuid tõeliselt agentlik süsteem otsustab sisemiselt, kuidas probleemile läheneda. See ei täida lihtsalt skripti; see määrab autonoomselt sammude järjekorra, lähtudes leitud teabe kvaliteedist. Näiteks, kui süsteemilt küsitakse tooteturundusstrateegia loomist, ei tugine see ainult päringule, mis kirjeldab kogu uurimis- ja otsustusprotsessi. Selle asemel otsustab agentlik mudel iseseisvalt:

  1. Hankida praegused turutrendide aruanded Bing Web Grounding abil.
  2. Tuvastada asjakohased konkurentide andmed Azure AI Searchi abil.
  3. Korreleerida ajaloolised sisemised müügimõõdikud Azure SQL Database’i abil.
  4. Sünteesida järeldused sidusaks strateegiaks, kasutades Azure OpenAI Service’i.
  5. Hinnata strateegiat puuduste või ebakõlade osas, vajadusel algatades uue otsingutsükli.

Kõik need sammud—päringute täpsustamine, allikate valimine, iteratsioon kuni vastusega rahulolu saavutamiseni—otsustab mudel ise, mitte inimene.

Iteratiivsed tsüklid, tööriistade integreerimine ja mälu

Tool Integration Architecture

Agentlik süsteem tugineb korduvatele interaktsioonimustritele:

Aja jooksul loob see areneva arusaama tunde, võimaldades mudelil navigeerida keerukates, mitmeastmelistes ülesannetes ilma, et inimene peaks pidevalt sekkuma või päringut ümber kujundama.

Ebaõnnestumiste käsitlemine ja enesekorrektsioon

Agentic RAG-i autonoomia hõlmab ka tugevaid enesekorrektsiooni mehhanisme. Kui süsteem jõuab ummikusse—näiteks hankides ebaolulisi dokumente või kohates vigaseid päringuid—võib see:

See iteratiivne ja dünaamiline lähenemine võimaldab mudelil pidevalt paraneda, tagades, et see pole lihtsalt ühekordne süsteem, vaid selline, mis õpib oma eksimustest antud sessiooni jooksul.

Self Correction Mechanism

Agentlikkuse piirid

Hoolimata autonoomiast ülesande sees, ei ole Agentic RAG samaväärne üldise tehisintellektiga. Selle “agentlikud” võimed on piiratud tööriistade, andmeallikate ja poliitikatega, mille on määranud inimarendajad. See ei saa leiutada oma tööriistu ega astuda väljapoole määratud valdkonna piire. Pigem paistab see silma olemasolevate ressursside dünaamilise orkestreerimisega.

Peamised erinevused arenenumatest AI vormidest hõlmavad:

  1. Valdkonnapõhine autonoomia: Agentic RAG süsteemid keskenduvad kasutaja määratud eesmärkide saavutamisele tuntud valdkonnas, kasutades strateegiaid nagu päringute ümberkirjutamine või tööriistade valimine tulemuste parandamiseks.
  2. Infrastruktuuri sõltuvus: Süsteemi võimed sõltuvad arendajate integreeritud tööriistadest ja andmetest. See ei saa ületada neid piire ilma inimsekkumiseta.
  3. Kaitsemeetmete järgimine: Eetilised juhised, vastavusreeglid ja äripoliitikad jäävad väga oluliseks. Agendi vabadus on alati piiratud turvameetmete ja järelevalvemehhanismidega (loodetavasti?).

Praktilised kasutusjuhtumid ja väärtus

Agentic RAG paistab silma olukordades, mis nõuavad iteratiivset täpsustamist ja täpsust:

  1. Täpsust nõudvad keskkonnad: Vastavuskontrollides, regulatiivses analüüsis või juriidilises uurimises suudab agentlik mudel korduvalt kontrollida fakte, konsulteerida mitme allikaga ja kirjutada päringuid ümber, kuni see annab põhjalikult kontrollitud vastuse.
  2. Keerulised andmebaasi interaktsioonid: Struktureeritud andmetega töötamisel, kus päringud võivad sageli ebaõnnestuda või vajada kohandamist, suudab süsteem autonoomselt täpsustada oma päringuid, kasutades Azure SQL-i või Microsoft Fabric OneLake’i, tagades, et lõplik otsing vastab kasutaja kavatsusele.
  3. Pikemad töövood: Pikemad sessioonid võivad areneda, kui ilmneb uus teave. Agentic RAG suudab pidevalt integreerida uusi andmeid, muutes strateegiaid, kui see õpib probleemiruumi kohta rohkem.

Juhtimine, läbipaistvus ja usaldus

Kuna need süsteemid muutuvad oma mõtlemises autonoomsemaks, on juhtimine ja läbipaistvus üliolulised:

Tööriistad, mis pakuvad selget ülevaadet toimingutest, on hädavajalikud. Ilma nendeta võib mitmeastmelise protsessi silumine olla väga keeruline. Vaata järgmist näidet Literal AI-st (Chainlit’i taga olev ettevõte) agendi töö kohta:

AgentRunExample

Kokkuvõte

Agentic RAG esindab loomulikku evolutsiooni selles, kuidas AI süsteemid käsitlevad keerukaid, andmemahukaid ülesandeid. Kasutades korduvat interaktsioonimustrit, valides autonoomselt tööriistu ja täpsustades päringuid, kuni saavutatakse kvaliteetne tulemus, liigub süsteem staatilisest päringujärgimisest kohanemisvõimelisema ja kontekstitundlikuma otsustaja suunas. Kuigi see on endiselt piiratud inimeste määratletud infrastruktuuride ja eetiliste juhistega, võimaldavad need agentlikud

Akadeemilised artiklid

Eelmine õppetund

Tool Use Design Pattern

Järgmine õppetund

Building Trustworthy AI Agents


Lahtiütlus:
See dokument on tõlgitud AI tõlketeenuse Co-op Translator abil. Kuigi püüame tagada täpsust, palume arvestada, et automaatsed tõlked võivad sisaldada vigu või ebatäpsusi. Algne dokument selle algses keeles tuleks pidada autoriteetseks allikaks. Olulise teabe puhul soovitame kasutada professionaalset inimtõlget. Me ei vastuta selle tõlke kasutamisest tulenevate arusaamatuste või valesti tõlgenduste eest.