ai-agents-for-beginners

Agentic RAG

(Kliknite na sliku iznad za video lekcije)

Agentic RAG

Ova lekcija pruža sveobuhvatan pregled Agentic Retrieval-Augmented Generation (Agentic RAG), novog AI pristupa u kojem veliki jezični modeli (LLM-ovi) autonomno planiraju svoje sljedeće korake dok prikupljaju informacije iz vanjskih izvora. Za razliku od statičnih obrazaca “prikupljanje pa čitanje”, Agentic RAG uključuje iterativne pozive LLM-u, izmjenjujući se s pozivima alatima ili funkcijama i strukturiranim izlazima. Sustav procjenjuje rezultate, poboljšava upite, poziva dodatne alate ako je potrebno i nastavlja ovaj ciklus dok ne postigne zadovoljavajuće rješenje.

Uvod

Ova lekcija obuhvaća:

Ciljevi učenja

Nakon završetka ove lekcije, znat ćete kako/razumjeti:

Što je Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) je novi AI pristup u kojem veliki jezični modeli (LLM-ovi) autonomno planiraju svoje sljedeće korake dok prikupljaju informacije iz vanjskih izvora. Za razliku od statičnih obrazaca “prikupljanje pa čitanje”, Agentic RAG uključuje iterativne pozive LLM-u, izmjenjujući se s pozivima alatima ili funkcijama i strukturiranim izlazima. Sustav procjenjuje rezultate, poboljšava upite, poziva dodatne alate ako je potrebno i nastavlja ovaj ciklus dok ne postigne zadovoljavajuće rješenje. Ovaj iterativni stil “maker-checker” poboljšava točnost, rješava neispravne upite i osigurava visokokvalitetne rezultate.

Sustav aktivno preuzima odgovornost za proces zaključivanja, prepisuje neuspjele upite, bira različite metode prikupljanja informacija i integrira više alata—poput vektorskog pretraživanja u Azure AI Search, SQL baza podataka ili prilagođenih API-ja—prije nego što finalizira svoj odgovor. Ključna kvaliteta agentičkog sustava je njegova sposobnost da preuzme odgovornost za proces zaključivanja. Tradicionalne RAG implementacije oslanjaju se na unaprijed definirane putove, dok agentički sustav autonomno određuje redoslijed koraka na temelju kvalitete pronađenih informacija.

Definicija Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) je novi pristup u razvoju AI-a gdje LLM-ovi ne samo da prikupljaju informacije iz vanjskih izvora podataka, već i autonomno planiraju svoje sljedeće korake. Za razliku od statičnih obrazaca “prikupljanje pa čitanje” ili pažljivo skriptiranih sekvenci upita, Agentic RAG uključuje iterativni proces poziva LLM-u, izmjenjujući se s pozivima alatima ili funkcijama i strukturiranim izlazima. Na svakom koraku sustav procjenjuje rezultate koje je dobio, odlučuje hoće li poboljšati upite, poziva dodatne alate ako je potrebno i nastavlja ovaj ciklus dok ne postigne zadovoljavajuće rješenje.

Ovaj iterativni stil “maker-checker” osmišljen je za poboljšanje točnosti, rješavanje neispravnih upita prema strukturiranim bazama podataka (npr. NL2SQL) i osiguravanje uravnoteženih, visokokvalitetnih rezultata. Umjesto da se oslanja isključivo na pažljivo osmišljene sekvence upita, sustav aktivno preuzima odgovornost za proces zaključivanja. Može prepisati neuspjele upite, odabrati različite metode prikupljanja informacija i integrirati više alata—poput vektorskog pretraživanja u Azure AI Search, SQL baza podataka ili prilagođenih API-ja—prije nego što finalizira svoj odgovor. Ovo uklanja potrebu za prekompliciranim okvirima orkestracije. Umjesto toga, relativno jednostavan ciklus “poziv LLM-u → korištenje alata → poziv LLM-u → …” može rezultirati sofisticiranim i dobro utemeljenim izlazima.

Agentic RAG Core Loop

Vlasništvo nad procesom zaključivanja

Ključna kvaliteta koja sustav čini “agentičkim” je njegova sposobnost da preuzme odgovornost za proces zaključivanja. Tradicionalne RAG implementacije često ovise o ljudima koji unaprijed definiraju put za model: lanac razmišljanja koji određuje što prikupljati i kada. No, kada je sustav zaista agentički, on interno odlučuje kako pristupiti problemu. Ne izvršava samo skriptu; autonomno određuje redoslijed koraka na temelju kvalitete pronađenih informacija. Na primjer, ako se od njega zatraži da kreira strategiju lansiranja proizvoda, ne oslanja se isključivo na upit koji detaljno opisuje cijeli proces istraživanja i donošenja odluka. Umjesto toga, agentički model samostalno odlučuje:

  1. Prikupiti izvještaje o trenutnim tržišnim trendovima koristeći Bing Web Grounding.
  2. Identificirati relevantne podatke o konkurenciji koristeći Azure AI Search.
  3. Povezati povijesne interne prodajne metrike koristeći Azure SQL Database.
  4. Sintetizirati nalaze u kohezivnu strategiju orkestriranu putem Azure OpenAI Service.
  5. Evaluirati strategiju za praznine ili nedosljednosti, pokrećući još jedan krug prikupljanja informacija ako je potrebno.

Svi ovi koraci—poboljšavanje upita, odabir izvora, iteracija dok ne bude “zadovoljan” odgovorom—odlučuje model, a ne unaprijed skriptirani koraci od strane čovjeka.

Iterativni ciklusi, integracija alata i memorija

Tool Integration Architecture

Agentički sustav oslanja se na iterativni obrazac interakcije:

S vremenom, ovo stvara osjećaj evoluirajućeg razumijevanja, omogućujući modelu da navigira složenim, višestupanjskim zadacima bez potrebe za stalnom intervencijom ili preoblikovanjem upita od strane čovjeka.

Rješavanje neuspjeha i samoispravak

Autonomija Agentic RAG-a također uključuje robusne mehanizme samoispravka. Kada sustav naiđe na prepreke—poput prikupljanja irelevantnih dokumenata ili neispravnih upita—može:

Ovaj iterativni i dinamični pristup omogućuje modelu kontinuirano poboljšanje, osiguravajući da nije samo sustav za jednokratnu upotrebu, već onaj koji uči iz svojih pogrešaka tijekom određene sesije.

Self Correction Mechanism

Granice autonomije

Unatoč svojoj autonomiji unutar zadatka, Agentic RAG nije analogan umjetnoj općoj inteligenciji. Njegove “agentičke” sposobnosti ograničene su na alate, izvore podataka i politike koje su osigurali ljudski programeri. Ne može izumiti vlastite alate niti izaći izvan granica domene koje su postavljene. Umjesto toga, briljira u dinamičnom orkestriranju dostupnih resursa.

Ključne razlike u odnosu na naprednije oblike AI-a uključuju:

  1. Autonomija specifična za domenu: Sustavi Agentic RAG-a fokusirani su na postizanje ciljeva koje je definirao korisnik unutar poznate domene, koristeći strategije poput prepisivanja upita ili odabira alata za poboljšanje rezultata.
  2. Ovisnost o infrastrukturi: Sposobnosti sustava ovise o alatima i podacima koje su integrirali programeri. Ne može nadmašiti te granice bez ljudske intervencije.
  3. Poštivanje sigurnosnih mjera: Etičke smjernice, pravila usklađenosti i poslovne politike ostaju vrlo važne. Sloboda agenta uvijek je ograničena sigurnosnim mjerama i mehanizmima nadzora (nadamo se?).

Praktične primjene i vrijednost

Agentic RAG briljira u scenarijima koji zahtijevaju iterativno poboljšanje i preciznost:

  1. Okruženja usmjerena na točnost: U provjerama usklađenosti, regulatornim analizama ili pravnim istraživanjima, agentički model može više puta provjeravati činjenice, konzultirati više izvora i prepisivati upite dok ne proizvede temeljito provjeren odgovor.
  2. Složene interakcije s bazama podataka: Kada se radi o strukturiranim podacima gdje upiti često mogu ne uspjeti ili zahtijevati prilagodbu, sustav može autonomno poboljšavati svoje upite koristeći Azure SQL ili Microsoft Fabric OneLake, osiguravajući da konačno prikupljanje odgovara namjeri korisnika.
  3. Prošireni tijekovi rada: Duže sesije mogu se razvijati kako se pojavljuju nove informacije. Agentic RAG može kontinuirano uključivati nove podatke, mijenjajući strategije kako više uči o prostoru problema.

Upravljanje, transparentnost i povjerenje

Kako ovi sustavi postaju autonomniji u svom zaključivanju, upravljanje i transparentnost su ključni:

Imati alate koji pružaju jasan zapis radnji je ključno. Bez njih, otklanjanje problema u višestupanjskom procesu može biti vrlo teško. Pogledajte sljedeći primjer iz Literal AI (tvrtka iza Chainlit-a) za Agent run:

AgentRunExample

Zaključak

Agentic RAG predstavlja prirodnu evoluciju u načinu na koji AI sustavi rješavaju složene, podatkovno intenzivne zadatke. Usvajanjem iterativnog obrasca interakcije, autonomnim odabirom alata i poboljšavanjem upita dok ne postigne visokokvalitetan rezultat, sustav prelazi granice statičnog praćenja upita u adaptivnog, kontekstualno svjesnog donositelja odluka. Iako je još uvijek ograničen ljudski definiranim infrastrukturama i etičkim smjernicama, ove agentičke sposobnosti omogućuju bogatije, dinamičnije i na kraju korisnije AI interakcije za poduzeća i krajnje korisnike.

Imate li dodatnih pitanja o Agentic RAG-u?

Pridružite se Azure AI Foundry Discordu kako biste se povezali s drugim učenicima, prisustvovali uredskim satima i dobili odgovore na svoja pitanja o AI agentima.

Dodatni resursi

Akademski radovi

Prethodna lekcija

Oblikovanje uzorka za korištenje alata

Sljedeća lekcija

Izgradnja pouzdanih AI agenata


Izjava o odricanju odgovornosti:
Ovaj dokument je preveden pomoću AI usluge za prevođenje Co-op Translator. Iako nastojimo osigurati točnost, imajte na umu da automatski prijevodi mogu sadržavati pogreške ili netočnosti. Izvorni dokument na izvornom jeziku treba smatrati autoritativnim izvorom. Za ključne informacije preporučuje se profesionalni prijevod od strane stručnjaka. Ne preuzimamo odgovornost za nesporazume ili pogrešna tumačenja koja mogu proizaći iz korištenja ovog prijevoda.