ai-agents-for-beginners

Agentic RAG

(Kliknite na sliku iznad za pregled videa ove lekcije)

Agentic RAG

Ova lekcija pruža sveobuhvatan pregled Agentic Retrieval-Augmented Generation (Agentic RAG), novog AI pristupa u kojem veliki jezični modeli (LLM-ovi) autonomno planiraju svoje sljedeće korake dok prikupljaju informacije iz vanjskih izvora. Za razliku od statičnih obrazaca “pronađi pa pročitaj”, Agentic RAG uključuje iterativne pozive LLM-u, izmjenjujući se s pozivima alata ili funkcija i strukturiranim izlazima. Sustav procjenjuje rezultate, usavršava upite, poziva dodatne alate ako je potrebno i nastavlja ovaj ciklus dok ne postigne zadovoljavajuće rješenje.

Uvod

Ova lekcija obuhvaća:

Ciljevi učenja

Nakon završetka ove lekcije, znat ćete kako/razumjeti:

Što je Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) je novi AI pristup u kojem veliki jezični modeli (LLM-ovi) autonomno planiraju svoje sljedeće korake dok prikupljaju informacije iz vanjskih izvora. Za razliku od statičnih obrazaca “pronađi pa pročitaj”, Agentic RAG uključuje iterativne pozive LLM-u, izmjenjujući se s pozivima alata ili funkcija i strukturiranim izlazima. Sustav procjenjuje rezultate, usavršava upite, poziva dodatne alate ako je potrebno i nastavlja ovaj ciklus dok ne postigne zadovoljavajuće rješenje. Ovaj iterativni stil “maker-checker” poboljšava točnost, rješava neispravne upite i osigurava visokokvalitetne rezultate.

Sustav aktivno preuzima odgovornost za svoj proces zaključivanja, prepravljajući neuspjele upite, birajući različite metode dohvaćanja i integrirajući više alata—poput vektorskog pretraživanja u Azure AI Search, SQL baza podataka ili prilagođenih API-ja—prije nego što finalizira svoj odgovor. Ono što razlikuje agentički sustav je njegova sposobnost da preuzme odgovornost za svoj proces zaključivanja. Tradicionalne RAG implementacije oslanjaju se na unaprijed definirane putanje, dok agentički sustav autonomno određuje slijed koraka na temelju kvalitete pronađenih informacija.

Definiranje Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) je novi pristup u razvoju AI-a gdje LLM-ovi ne samo da prikupljaju informacije iz vanjskih izvora podataka već i autonomno planiraju svoje sljedeće korake. Za razliku od statičnih obrazaca “pronađi pa pročitaj” ili pažljivo skriptiranih nizova upita, Agentic RAG uključuje petlju iterativnih poziva LLM-u, izmjenjujući se s pozivima alata ili funkcija i strukturiranim izlazima. Na svakom koraku sustav procjenjuje dobivene rezultate, odlučuje hoće li usavršiti svoje upite, poziva dodatne alate ako je potrebno i nastavlja ovaj ciklus dok ne postigne zadovoljavajuće rješenje.

Ovaj iterativni stil rada “maker-checker” osmišljen je za poboljšanje točnosti, rješavanje neispravnih upita prema strukturiranim bazama podataka (npr. NL2SQL) i osiguravanje uravnoteženih, visokokvalitetnih rezultata. Umjesto da se oslanja isključivo na pažljivo osmišljene nizove upita, sustav aktivno preuzima odgovornost za svoj proces zaključivanja. Može prepravljati neuspjele upite, birati različite metode dohvaćanja i integrirati više alata—poput vektorskog pretraživanja u Azure AI Search, SQL baza podataka ili prilagođenih API-ja—prije nego što finalizira svoj odgovor. To uklanja potrebu za prekompliciranim orkestracijskim okvirima. Umjesto toga, relativno jednostavna petlja “LLM poziv → korištenje alata → LLM poziv → …” može rezultirati sofisticiranim i dobro utemeljenim izlazima.

Agentic RAG Core Loop

Preuzimanje odgovornosti za proces zaključivanja

Ono što sustav čini “agentičkim” je njegova sposobnost da preuzme odgovornost za svoj proces zaključivanja. Tradicionalne RAG implementacije često ovise o ljudima koji unaprijed definiraju putanju za model: lanac razmišljanja koji određuje što dohvatiti i kada.
Ali kada je sustav zaista agentički, on interno odlučuje kako pristupiti problemu. Ne izvršava samo skriptu; autonomno određuje slijed koraka na temelju kvalitete pronađenih informacija.
Na primjer, ako se od njega zatraži da kreira strategiju lansiranja proizvoda, ne oslanja se samo na upit koji detaljno opisuje cijeli tijek istraživanja i donošenja odluka. Umjesto toga, agentički model samostalno odlučuje:

  1. Dohvatiti trenutne izvještaje o tržišnim trendovima koristeći Bing Web Grounding.
  2. Identificirati relevantne podatke o konkurenciji koristeći Azure AI Search.
  3. Povezati povijesne interne prodajne metrike koristeći Azure SQL Database.
  4. Sintetizirati nalaze u kohezivnu strategiju orkestriranu putem Azure OpenAI Service.
  5. Procijeniti strategiju za praznine ili nedosljednosti, pokrećući još jedan krug dohvaćanja ako je potrebno.

Svi ovi koraci—usavršavanje upita, odabir izvora, iteracija dok ne bude “zadovoljan” odgovorom—odlučuje model, a ne unaprijed skriptirani ljudski koraci.

Iterativne petlje, integracija alata i memorija

Tool Integration Architecture

Agentički sustav oslanja se na uzorak interakcije u petlji:

S vremenom, ovo stvara osjećaj evoluirajućeg razumijevanja, omogućujući modelu da navigira složenim, višestupanjskim zadacima bez potrebe za stalnom ljudskom intervencijom ili preoblikovanjem upita.

Rukovanje neuspjesima i samoispravljanje

Autonomija Agentic RAG-a također uključuje robusne mehanizme samoispravljanja. Kada sustav naiđe na slijepu ulicu—poput dohvaćanja irelevantnih dokumenata ili nailaska na neispravne upite—može:

Ovaj iterativni i dinamični pristup omogućuje modelu kontinuirano poboljšanje, osiguravajući da nije samo sustav za jednokratnu upotrebu, već onaj koji uči iz svojih pogrešaka tijekom određene sesije.

Self Correction Mechanism

Granice agentičnosti

Unatoč svojoj autonomiji unutar zadatka, Agentic RAG nije analogan umjetnoj općoj inteligenciji. Njegove “agentičke” sposobnosti ograničene su na alate, izvore podataka i politike koje su osigurali ljudski programeri. Ne može izmišljati vlastite alate niti izlaziti izvan granica domena koje su postavljene. Umjesto toga, briljira u dinamičnom orkestriranju dostupnih resursa.
Ključne razlike u odnosu na naprednije AI oblike uključuju:

  1. Autonomija specifična za domenu: Agentic RAG sustavi fokusirani su na postizanje ciljeva koje definira korisnik unutar poznate domene, koristeći strategije poput prepravljanja upita ili odabira alata za poboljšanje rezultata.
  2. Ovisnost o infrastrukturi: Sposobnosti sustava ovise o alatima i podacima koje su integrirali programeri. Ne može nadmašiti te granice bez ljudske intervencije.
  3. Poštivanje sigurnosnih ograda: Etičke smjernice, pravila usklađenosti i poslovne politike ostaju vrlo važne. Sloboda agenta uvijek je ograničena sigurnosnim mjerama i mehanizmima nadzora (nadamo se?).

Praktični slučajevi upotrebe i vrijednost

Agentic RAG briljira u scenarijima koji zahtijevaju iterativno usavršavanje i preciznost:

  1. Okruženja gdje je točnost prioritet: U provjerama usklađenosti, regulatornim analizama ili pravnim istraživanjima, agentički model može ponavljano provjeravati činjenice, konzultirati više izvora i prepravljati upite dok ne proizvede temeljito provjeren odgovor.
  2. Složene interakcije s bazama podataka: Kada se radi o strukturiranim podacima gdje upiti često mogu ne uspjeti ili trebaju prilagodbu, sustav može autonomno usavršavati svoje upite koristeći Azure SQL ili Microsoft Fabric OneLake, osiguravajući da konačno dohvaćanje odgovara korisnikovoj namjeri.
  3. Produženi radni tijekovi: Duže sesije mogu se razvijati kako se pojavljuju nove informacije. Agentic RAG može kontinuirano uključivati nove podatke, mijenjajući strategije kako saznaje više o problemu.

Upravljanje, transparentnost i povjerenje

Kako ovi sustavi postaju autonomniji u svom zaključivanju, upravljanje i transparentnost su ključni:

Imati alate koji pružaju jasan zapis radnji je ključno. Bez njih, otklanjanje pogrešaka u višestupanjskom procesu može biti vrlo teško. Pogledajte sljedeći primjer iz Literal AI (tvrtka iza Chainlit-a) za Agent run:

AgentRunExample

AgentRunExample2

Zaključak

Agentic RAG predstavlja prirodnu evoluciju u načinu na koji AI sustavi rješavaju složene, podatkovno intenzivne zadatke. Usvajanjem uzorka interakcije u petlji, autonomnim odabirom alata i usavršavanjem upita dok ne postigne visokokvalitetan rezultat, sustav prelazi granice statičnog praćenja upita u adaptivnijeg, kontekstualno svjesnog donositelja odluka. Iako je još uvijek ograničen ljudski definiranim infrastrukturama i etičkim smjernicama, ove agentičke sposobnosti omogućuju bogatije, dinamičnije i na kraju korisnije AI interakcije za poduzeća i krajnje korisnike.

Imate još pitanja o Agentic RAG-u?

Pridružite se Azure AI Foundry Discord kako biste se povezali s drugim učenicima, Implementacija Retrieval Augmented Generation (RAG) s Azure OpenAI Service: Naučite kako koristiti vlastite podatke s Azure OpenAI Service. Ovaj Microsoft Learn modul pruža sveobuhvatan vodič za implementaciju RAG-a

Akademski radovi

Prethodna lekcija

Tool Use Design Pattern

Sljedeća lekcija

Building Trustworthy AI Agents


Odricanje od odgovornosti:
Ovaj dokument je preveden pomoću AI usluge za prevođenje Co-op Translator. Iako nastojimo osigurati točnost, imajte na umu da automatski prijevodi mogu sadržavati pogreške ili netočnosti. Izvorni dokument na izvornom jeziku treba smatrati autoritativnim izvorom. Za ključne informacije preporučuje se profesionalni prijevod od strane ljudskog prevoditelja. Ne preuzimamo odgovornost za bilo kakve nesporazume ili pogrešne interpretacije koje proizlaze iz korištenja ovog prijevoda.