ai-agents-for-beginners

Agentic RAG

(Spustelėkite paveikslėlį aukščiau, kad peržiūrėtumėte šios pamokos vaizdo įrašą)

Agentic RAG

Ši pamoka pateikia išsamų Agentic Retrieval-Augmented Generation (Agentic RAG) apžvalgą – naują AI paradigmą, kurioje dideli kalbos modeliai (LLMs) savarankiškai planuoja savo veiksmus, tuo pačiu rinkdami informaciją iš išorinių šaltinių. Skirtingai nuo statinių informacijos paieškos ir skaitymo modelių, Agentic RAG apima iteracinius LLM kvietimus, pertraukiamus įrankių ar funkcijų naudojimu ir struktūrizuotais rezultatais. Sistema vertina rezultatus, tobulina užklausas, prireikus naudoja papildomus įrankius ir tęsia šį ciklą, kol pasiekiamas patenkinamas sprendimas.

Įvadas

Šioje pamokoje aptarsime:

Mokymosi tikslai

Baigę šią pamoką, jūs sužinosite, kaip:

Kas yra Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) yra nauja AI paradigma, kurioje dideli kalbos modeliai (LLMs) savarankiškai planuoja savo veiksmus, tuo pačiu rinkdami informaciją iš išorinių šaltinių. Skirtingai nuo statinių informacijos paieškos ir skaitymo modelių, Agentic RAG apima iteracinius LLM kvietimus, pertraukiamus įrankių ar funkcijų naudojimu ir struktūrizuotais rezultatais. Sistema vertina rezultatus, tobulina užklausas, prireikus naudoja papildomus įrankius ir tęsia šį ciklą, kol pasiekiamas patenkinamas sprendimas. Šis iteracinis „maker-checker“ stilius gerina tikslumą, tvarko netinkamas užklausas ir užtikrina aukštos kokybės rezultatus.

Sistema aktyviai valdo savo sprendimų priėmimo procesą, perrašydama nepavykusias užklausas, pasirinkdama skirtingus paieškos metodus ir integruodama kelis įrankius – tokius kaip vektorinė paieška Azure AI Search, SQL duomenų bazės ar pritaikytos API – prieš pateikdama galutinį atsakymą. Agentinės sistemos išskirtinė savybė yra gebėjimas savarankiškai valdyti sprendimų priėmimo procesą. Tradicinės RAG implementacijos remiasi iš anksto nustatytais keliais, tačiau agentinė sistema savarankiškai nustato veiksmų seką, remdamasi surinktos informacijos kokybe.

Agentic Retrieval-Augmented Generation (Agentic RAG) apibrėžimas

Agentic Retrieval-Augmented Generation (Agentic RAG) yra nauja AI vystymo paradigma, kurioje LLM ne tik renka informaciją iš išorinių duomenų šaltinių, bet ir savarankiškai planuoja savo veiksmus. Skirtingai nuo statinių informacijos paieškos ir skaitymo modelių ar kruopščiai sukonstruotų užklausų sekų, Agentic RAG apima iteracinių LLM kvietimų ciklą, pertraukiamą įrankių ar funkcijų naudojimu ir struktūrizuotais rezultatais. Kiekviename žingsnyje sistema vertina gautus rezultatus, nusprendžia, ar reikia tobulinti užklausas, prireikus naudoja papildomus įrankius ir tęsia šį ciklą, kol pasiekiamas patenkinamas sprendimas.

Šis iteracinis „maker-checker“ veikimo stilius skirtas gerinti tikslumą, tvarkyti netinkamas užklausas struktūrizuotose duomenų bazėse (pvz., NL2SQL) ir užtikrinti subalansuotus, aukštos kokybės rezultatus. Vietoj to, kad remtųsi kruopščiai sukonstruotomis užklausų grandinėmis, sistema aktyviai valdo savo sprendimų priėmimo procesą. Ji gali perrašyti nepavykusias užklausas, pasirinkti skirtingus paieškos metodus ir integruoti kelis įrankius – tokius kaip vektorinė paieška Azure AI Search, SQL duomenų bazės ar pritaikytos API – prieš pateikdama galutinį atsakymą. Tai pašalina poreikį sudėtingoms orkestravimo sistemoms. Vietoj to, santykinai paprastas ciklas „LLM kvietimas → įrankio naudojimas → LLM kvietimas → …“ gali duoti sudėtingus ir gerai pagrįstus rezultatus.

Agentic RAG Core Loop

Valdyti sprendimų priėmimo procesą

Agentinės sistemos išskirtinė savybė yra gebėjimas savarankiškai valdyti sprendimų priėmimo procesą. Tradicinės RAG implementacijos dažnai priklauso nuo žmonių, kurie iš anksto nustato modelio kelią: minčių grandinę, nurodančią, ką ir kada rinkti. Tačiau tikrai agentinė sistema pati nusprendžia, kaip spręsti problemą. Ji ne tik vykdo scenarijų; ji savarankiškai nustato veiksmų seką, remdamasi surinktos informacijos kokybe. Pavyzdžiui, jei jai pavesta sukurti produkto pristatymo strategiją, ji nesiremia vien užklausa, kuri išdėsto visą tyrimo ir sprendimų priėmimo procesą. Vietoj to, agentinis modelis savarankiškai nusprendžia:

  1. Rinkti dabartinių rinkos tendencijų ataskaitas naudojant Bing Web Grounding.
  2. Identifikuoti svarbius konkurentų duomenis naudojant Azure AI Search.
  3. Koreliuoti istorinius vidinius pardavimų rodiklius naudojant Azure SQL Database.
  4. Sintetinti išvadas į nuoseklią strategiją, koordinuojamą per Azure OpenAI Service.
  5. Įvertinti strategiją dėl spragų ar nenuoseklumų, prireikus inicijuojant dar vieną informacijos rinkimo etapą. Visi šie žingsniai – užklausų tobulinimas, šaltinių pasirinkimas, iteracija, kol pasiekiamas „patenkinamas“ atsakymas – yra modelio sprendimai, o ne iš anksto nustatyti žmogaus.

Iteraciniai ciklai, įrankių integracija ir atmintis

Tool Integration Architecture

Agentinė sistema remiasi cikline sąveikos struktūra:

Laikui bėgant tai sukuria evoliucinio supratimo jausmą, leidžiantį modeliui atlikti sudėtingas, daugiapakopes užduotis, nereikalaujant nuolatinės žmogaus intervencijos ar užklausos formavimo.

Gedimų valdymas ir savikorekcija

Agentic RAG autonomija taip pat apima tvirtus savikorekcijos mechanizmus. Kai sistema susiduria su kliūtimis – pvz., surenka nereikšmingus dokumentus ar susiduria su netinkamomis užklausomis – ji gali:

Šis iteracinis ir dinamiškas požiūris leidžia modeliui nuolat tobulėti, užtikrinant, kad jis nėra vienkartinė sistema, o tokia, kuri mokosi iš savo klaidų per tam tikrą sesiją.

Self Correction Mechanism

Agentūros ribos

Nepaisant autonomijos užduotyje, Agentic RAG nėra analogiškas dirbtiniam bendram intelektui. Jo „agentinės“ galimybės yra apribotos įrankiais, duomenų šaltiniais ir politikomis, kurias pateikia žmogaus kūrėjai. Jis negali sukurti savo įrankių ar peržengti nustatytų srities ribų. Vietoj to, jis puikiai tinka dinamiškai koordinuoti turimus išteklius. Pagrindiniai skirtumai nuo pažangesnių AI formų apima:

  1. Specifinė srities autonomija: Agentic RAG sistemos yra orientuotos į vartotojo apibrėžtų tikslų pasiekimą žinomoje srityje, naudojant strategijas, tokias kaip užklausų perrašymas ar įrankių pasirinkimas, siekiant geresnių rezultatų.
  2. Infrastruktūros priklausomybė: Sistemos galimybės priklauso nuo kūrėjų integruotų įrankių ir duomenų. Ji negali peržengti šių ribų be žmogaus intervencijos.
  3. Saugumo priemonių laikymasis: Etikos gairės, atitikties taisyklės ir verslo politikos išlieka labai svarbios. Agento laisvė visada yra apribota saugumo priemonėmis ir priežiūros mechanizmais (tikėkimės?).

Praktinės taikymo sritys ir vertė

Agentic RAG ypač naudingas scenarijuose, kuriems reikia iteracinio tobulinimo ir tikslumo:

  1. Tikslumo reikalaujančios aplinkos: Atitikties patikrinimuose, reguliavimo analizėje ar teisinių tyrimų srityje agentinis modelis gali pakartotinai tikrinti faktus, konsultuotis su keliais šaltiniais ir perrašyti užklausas, kol pateikia kruopščiai patikrintą atsakymą.
  2. Sudėtingos duomenų bazės sąveikos: Dirbant su struktūrizuotais duomenimis, kur užklausos dažnai gali nepavykti arba reikalauti korekcijos, sistema gali savarankiškai tobulinti užklausas, naudodama Azure SQL arba Microsoft Fabric OneLake, užtikrindama, kad galutinis rezultatas atitiktų vartotojo ketinimus.
  3. Ilgalaikiai darbo procesai: Ilgesnės sesijos gali evoliucionuoti, kai atsiranda nauja informacija. Agentic RAG gali nuolat įtraukti naujus duomenis, keisti strategijas, kai sužino daugiau apie problemos sritį.

Valdymas, skaidrumas ir pasitikėjimas

Kadangi šios sistemos tampa labiau autonomiškos savo sprendimų priėmimo procese, valdymas ir skaidrumas yra labai svarbūs:

Akademiniai straipsniai

Ankstesnė pamoka

Įrankių naudojimo dizaino šablonas

Kita pamoka

Patikimų AI agentų kūrimas


Atsakomybės apribojimas:
Šis dokumentas buvo išverstas naudojant dirbtinio intelekto vertimo paslaugą Co-op Translator. Nors siekiame tikslumo, atkreipiame dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas autoritetingu šaltiniu. Kritinei informacijai rekomenduojama naudotis profesionalių vertėjų paslaugomis. Mes neprisiimame atsakomybės už nesusipratimus ar klaidingus aiškinimus, kylančius dėl šio vertimo naudojimo.