ai-agents-for-beginners

Agentinė RAG

(Spustelėkite aukščiau esantį vaizdą, kad peržiūrėtumėte šios pamokos vaizdo įrašą)

Agentinė RAG

Ši pamoka pateikia išsamų Agentinės paieškos papildytos generacijos (Agentinė RAG) apžvalgą – naują dirbtinio intelekto paradigmą, kurioje dideli kalbos modeliai (LLM) savarankiškai planuoja savo kitus žingsnius, tuo pačiu traukdami informaciją iš išorinių šaltinių. Skirtingai nuo statinių paieškos-tada-skaitymo modelių, Agentinė RAG apima iteracinius LLM kvietimus, pertraukiamus įrankių ar funkcijų kvietimais ir struktūruotais atsakymais. Sistema įvertina rezultatus, tobulina užklausas, prireikus iškviečia papildomus įrankius ir tęsia šį ciklą tol, kol pasiekiamas patenkinamas sprendimas.

Įvadas

Šioje pamokoje aptarsime

Mokymosi tikslai

Baigę šią pamoką, sugebėsite/įsisavinsite:

Kas yra Agentinė RAG?

Agentinė paieškos papildyta generacija (Agentinė RAG) yra nauja AI paradigma, kurioje dideli kalbos modeliai (LLM) savarankiškai planuoja savo kitus veiksmus, tuo pat metu traukdami informaciją iš išorinių šaltinių. Skirtingai nuo statinių paieškos-tada-skaitymo modelių, Agentinė RAG apima iteracinius LLM kvietimus, pertraukiamus įrankių ar funkcijų kvietimais ir struktūruotais atsakymais. Sistema vertina gautus rezultatus, tobulina užklausas, prireikus iškviečia papildomus įrankius ir tęsia šį ciklą, kol pasiekiamas patenkinamas sprendimas. Šis iteracinis „maker-checker“ stilius gerina taisyklingumą, tvarko netaisyklingas užklausas ir užtikrina aukštos kokybės rezultatus.

Sistema aktyviai kontroliuoja savo samprotavimo procesą, perrašydama nepavykusias užklausas, pasirinkdama skirtingus paieškos metodus ir integruodama kelis įrankius – tokius kaip vektorinė paieška Azure AI Search, SQL duomenų bazės ar pritaikytos API – prieš pateikdama galutinį atsakymą. Išskirtinė agentinės sistemos savybė yra gebėjimas kontroliuoti savo samprotavimo procesą. Tradicinės RAG diegimo versijos remiasi iš anksto nustatytais keliais, tačiau agentinė sistema autonomiškai nusprendžia žingsnių seką pagal rastos informacijos kokybę.

Agentinės paieškos papildytos generacijos (Agentinė RAG) apibrėžimas

Agentinė paieškos papildyta generacija (Agentinė RAG) yra nauja AI kūrimo paradigma, kurioje LLM ne tik traukia informaciją iš išorinių duomenų šaltinių, bet ir savarankiškai planuoja savo kitus veiksmus. Skirtingai nuo statinių paieškos-tada-skaitymo modelių ar kruopščiai įrašytų užklausų sekų, Agentinė RAG apima iteracinį kvietimų LLM ciklą, pertraukiamą įrankių ar funkcijų kvietimais ir struktūruotais atsakymais. Kiekviename žingsnyje sistema įvertina gautus rezultatus, nusprendžia, ar reikia tobulinti užklausas, prireikus iškviečia papildomus įrankius ir tęsia šį ciklą, kol pasiekia patenkinamą sprendimą.

Šis iteracinis „maker-checker“ veikimo stilius skirtas pagerinti taisyklingumą, tvarkyti netaisyklingas užklausas į struktūruotas duomenų bazes (pvz., NL2SQL) ir užtikrinti subalansuotus, aukštos kokybės rezultatus. Vietoj vien tik kruopščiai sukurtų užklausų grandinių, sistema aktyviai kontroliuoja savo samprotavimo procesą. Ji gali perrašyti nepavykusias užklausas, pasirinkti kitus ištraukimo metodus ir integruoti kelis įrankius – kaip vektorinę paiešką Azure AI Search, SQL duomenų bazes ar pritaikytas API – prieš pateikdama galutinį atsakymą. Tai pašalina poreikį pernelyg sudėtingoms organizavimo sistemoms. Vietoj to, gana paprasta kilpa „LLM kvietimas → įrankio naudojimas → LLM kvietimas → …“ gali išvesti sudėtingus ir gerai pagrįstus atsakymus.

Agentinės RAG pagrindinė kilpa

Samprotavimo proceso valdymas

Išskirtinė savybė, kuri daro sistemą „agentine“, yra jos gebėjimas kontroliuoti savo samprotavimo procesą. Tradiciniai RAG įgyvendinimai dažnai priklauso nuo žmonių, iš anksto nustatančių modelio kelią: grandinę minties, kuri nurodo, ką ir kada gauti. Tačiau kai sistema iš tiesų agentinė, ji viduje nusprendžia, kaip spręsti problemą. Ji ne tik vykdo scenarijų; ji autonomiškai nustato žingsnių seką pagal rastos informacijos kokybę. Pavyzdžiui, jei sistemai pateikiama užduotis sukurti produkto paleidimo strategiją, ji nesiremia vien tik užklausa, kuri aprašo visą tyrimo ir sprendimų priėmimo eigą. Vietoje to, agentinis modelis nepriklausomai nusprendžia:

  1. Gauti dabartines rinkos tendencijų ataskaitas, naudojant Bing Web Grounding
  2. Nustatyti svarbius konkurentų duomenis, naudojant Azure AI Search.
  3. Koreliuoti istorinius vidinius pardavimų rodiklius, naudojant Azure SQL Database.
  4. Apjungti išvadas į vientisą strategiją, koordinuojamą per Azure OpenAI Service.
  5. Įvertinti strategiją spragoms ar neatitikimams, jei reikia, inicijuojant dar vieną paieškos etapą. Visus šiuos žingsnius – užklausų tobulinimą, šaltinių pasirinkimą, iteravimą tol, kol būna „patenkintas“ atsakymu – nusprendžia modelis, ne žmogus pagal scenarijų.

Iteracinės kilpos, įrankių integracija ir atmintis

Įrankių integracijos architektūra

Agentinė sistema remiasi kilpinio sąveikos modeliu:

Laikui bėgant, tai kuria supratimo pažangą, leidžiančią modeliui naviguoti sudėtingose, daugiapakopėse užduotyse be nuolatinės žmogaus intervencijos ar užklausos keitimo.

Gedimų valdymas ir savitikra

Agentinės RAG autonomija taip pat apima tvirtas savitikros priemones. Kai sistema pasiekia aklavietę – pvz., surenka nereikšmingus dokumentus arba susiduria su netaisyklingomis užklausomis – ji gali:

Šis iteracinis ir dinamiškas metodas leidžia modeliui nuolat tobulėti, užtikrinant, kad jis nėra vienkartinė sistema, bet mokosi iš savo klaidų per sesiją.

Savitikros mechanizmas

Agentūros ribos

Nepaisant savarankiškumo užduotyje, Agentinė RAG nėra lygiavertė dirbtiniam bendrojo intelekto lygmeniui. Jos „agentinės“ galimybės apsiriboja įrankiais, duomenų šaltiniais ir taisyklėmis, kurias nustato žmonių kūrėjai. Ji negali sukurti savo įrankių ar išeiti už nustatytų srities ribų. Vietoje to, ji puikiai tvarko turimus išteklius dinamiškai. Pagrindiniai skirtumai nuo pažangesnių DI formų apima:

  1. Srities specifinis savarankiškumas: Agentinės RAG sistemos sutelktos į vartotojo nustatytų tikslų pasiekimą žinomoje srityje, naudodamos tokias strategijas kaip užklausų perrašymas ar įrankių pasirinkimas rezultatams gerinti.
  2. Priklausomybė nuo infrastruktūros: Sistemos galimybės priklauso nuo įrankių ir duomenų, integruotų kūrėjų. Ji negali viršyti šių ribų be žmogaus įsikišimo.
  3. Taisyklių laikymasis: Etinės gairės, atitikties taisyklės ir verslo politika išlieka labai svarbios. Agento laisvė visada yra ribojama saugumo priemonių ir priežiūros mechanizmų (tikėtina?).

Praktiniai panaudojimo atvejai ir vertė

Agentinė RAG ypač naudinga situacijose, kur reikalingas iteracinis tobulinimas ir tikslumas:

  1. Taisyklingumo prioritetą turinčios aplinkos: Atitikties patikrinimuose, reguliavimo analizėje ar teisinėse tyrimuose agentinis modelis gali pakartotinai tikrinti faktus, konsultuotis su keliomis šaltinių grandinėmis ir perrašyti užklausas, kol pateikiamas kruopščiai patikrintas atsakymas.
  2. Sudėtinga duomenų bazės sąveika: Dirbdama su struktūruotais duomenimis, kuriuose užklausos dažnai gali nepavykti arba jas reikia reguliuoti, sistema savarankiškai tobulina užklausas, naudodama Azure SQL arba Microsoft Fabric OneLake, užtikrindama galutinio paieškos rezultato atitikimą vartotojo ketinimui.
  3. Išplėsti darbo srautai: Ilgesni seansai gali vystytis, kaip atsiranda naujos informacijos. Agentinė RAG gali nuolat integruoti naujus duomenis, keisdama strategijas, kai geriau supranta problemos sritį.

Valdymas, skaidrumas ir pasitikėjimas

Kadangi šios sistemos tampa autonomiškesnės savo samprotavimuose, valdymas ir skaidrumas yra labai svarbūs:

Turėti įrankius, kurie suteikia aiškią veiksmų seką, yra būtina. Be jų, daugiapakopių procesų derinimas gali būti labai sudėtingas. Žr. toliau pateiktą literal AI (įmonės už Chainlit) agentų vykdymo pavyzdį:

Agentų vykdymo pavyzdys

Išvada

Agentinė RAG atspindi natūralų dirbtinio intelekto sistemų vystymąsi, kaip jos tvarko sudėtingas, duomenų intensyvias užduotis. Priimdama kilpinio sąveikos modelį, autonomiškai pasirinkdama įrankius ir tobulindama užklausas iki aukštos kokybės rezultato, sistema žengia toliau nei statinis užklausų vykdymas ir tampa lankstesniu, kontekstą suprantančiu sprendimų priėmėju. Nors vis dar ribojama žmogaus nustatytos infrastruktūros ir etikos gairių, šios agentinės galimybės leidžia kurti turtingesnes, dinamiškesnes ir galutiniams vartotojams bei įmonėms naudingesnes AI sąveikas.

Turite daugiau klausimų apie Agentinę RAG?

Prisijunkite prie Microsoft Foundry Discord, susitikite su kitais besimokančiais, lankykite konsultacinius užsiėmimus ir gaukite atsakymus į klausimus apie AI Agentus.

Papildomi šaltiniai

Akademiniai straipsniai

Ankstesnė pamoka

Įrankių naudojimo dizaino šablonas

Kitas pamoka

Patikimų AI agentų kūrimas


Atsakomybės apribojimas: Šis dokumentas buvo išverstas naudojant dirbtinio intelekto vertimo paslaugą Co-op Translator. Nors stengiamės užtikrinti tikslumą, prašome atkreipti dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas autoritetingu šaltiniu. Kritinei informacijai rekomenduojamas profesionalus žmogaus atliktas vertimas. Mes neatsakome už bet kokius nesusipratimus ar neteisingus aiškinimus, kilusius naudojant šį vertimą.