ai-agents-for-beginners

Agentic RAG

(Kliknite na gornju sliku za pregled videa ove lekcije)

Agentic RAG

Ova lekcija pruža sveobuhvatan pregled Agentic Retrieval-Augmented Generation (Agentic RAG), novog AI paradigme u kojoj veliki jezični modeli (LLM-ovi) autonomno planiraju svoje sljedeće korake dok izvlače informacije iz vanjskih izvora. Za razliku od statičnih obrazaca “retrieval-then-read”, Agentic RAG uključuje iterativne pozive LLM-u, isprepletene pozivima alata ili funkcija i strukturiranim izlazima. Sustav procjenjuje rezultate, sužava upite, poziva dodatne alate po potrebi i nastavlja taj ciklus dok ne postigne zadovoljavajuće rješenje.

Uvod

Ova lekcija će obuhvatiti

Ciljevi učenja

Nakon završetka ove lekcije znat ćete/razumjeti:

Što je Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) je nova AI paradigma u kojoj veliki jezični modeli (LLM-ovi) autonomno planiraju svoje sljedeće korake dok izvlače informacije iz vanjskih izvora. Za razliku od statičnih obrazaca “retrieval-then-read”, Agentic RAG uključuje iterativne pozive LLM-u, isprepletene pozivima alata ili funkcija i strukturiranim izlazima. Sustav procjenjuje rezultate, sužava upite, poziva dodatne alate po potrebi i nastavlja ovaj ciklus dok ne postigne zadovoljavajuće rješenje. Ovaj iterativni “maker-checker” stil poboljšava ispravnost, rješava neispravne upite i osigurava visoku kvalitetu rezultata.

Sustav aktivno preuzima svoj proces rezoniranja, prepisujući neuspjele upite, birajući različite metode dohvaćanja i integrirajući više alata—kao što su pretraživanje vektora u Azure AI Search, SQL baze podataka ili prilagođeni API-ji—prije nego zaključi svoj odgovor. Razlikovna kvaliteta agentnog sustava je njegova sposobnost da preuzme vlastiti proces rezoniranja. Tradicionalne RAG implementacije oslanjaju se na unaprijed definirane puteve, dok agentni sustav autonomno određuje slijed koraka na temelju kvalitete pronađenih informacija.

Definiranje Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) je nova paradigma u razvoju AI-a gdje LLM-ovi ne samo da vuku informacije iz vanjskih izvora podataka već i autonomno planiraju svoje sljedeće korake. Za razliku od statičnih obrazaca “retrieval-then-read” ili pažljivo skriptiranih nizova promptova, Agentic RAG uključuje petlju iterativnih poziva LLM-u, isprepletenih pozivima alata ili funkcija i strukturiranim izlazima. Na svakom koraku sustav procjenjuje rezultate koje je dobio, odlučuje treba li suziti upite, poziva dodatne alate po potrebi i nastavlja taj ciklus dok ne postigne zadovoljavajuće rješenje.

Ovaj iterativni “maker-checker” stil rada dizajniran je za poboljšanje ispravnosti, rješavanje neispravnih upita prema strukturiranim bazama podataka (npr. NL2SQL) i osiguravanje uravnoteženih, visokokvalitetnih rezultata. Umjesto oslanjanja isključivo na pažljivo konstruirane lance promptova, sustav aktivno preuzima svoj proces rezoniranja. Može prepisati upite koji ne uspiju, odabrati različite metode dohvaćanja i integrirati više alata—kao što su pretraživanje vektora u Azure AI Search, SQL baze podataka ili prilagođeni API-ji—prije nego finalizira svoj odgovor. To uklanja potrebu za pretjerano složenim orkestracijskim okvirima. Umjesto toga, relativno jednostavna petlja “LLM poziv → korištenje alata → LLM poziv → …” može proizvesti sofisticirane i dobro utemeljene izlaze.

Agentic RAG Core Loop

Preuzimanje procesa rezoniranja

Razlikovna kvaliteta koja sustav čini “agentnim” je njegova sposobnost da preuzme vlastiti proces rezoniranja. Tradicionalne RAG implementacije često ovise o tome da ljudi unaprijed definiraju put za model: lanac razmišljanja koji opisuje što dohvatiti i kada. Ali kada je sustav zaista agentan, on iznutra odlučuje kako pristupiti problemu. Ne radi se samo o izvršavanju skripte; autonomno određuje redoslijed koraka na temelju kvalitete informacija koje pronađe. Na primjer, ako se traži da izradi strategiju lansiranja proizvoda, ne oslanja se isključivo na prompt koji opisuje cijeli istraživački i donošenje odluka radni tok. Umjesto toga, agentni model neovisno odlučuje:

  1. Dohvatiti aktualne izvještaje o tržišnim trendovima koristeći Bing Web Grounding
  2. Identificirati relevantne podatke o konkurentima koristeći Azure AI Search.
  3. Korrelirati povijesne interne metrike prodaje koristeći Azure SQL Database.
  4. Sintetizirati nalaze u koherentnu strategiju orkestriranu putem Azure OpenAI Service.
  5. Procijeniti strategiju za praznine ili nedosljednosti, potičući još jedno kolo dohvaćanja ako je potrebno. Svi ovi koraci—sužavanje upita, odabir izvora, iteriranje dok nije “zadovoljan” s odgovorom—odlučuju se od strane modela, a ne unaprijed skriptirano od strane čovjeka.

Iterativne petlje, integracija alata i memorija

Tool Integration Architecture

Agentni sustav se oslanja na obrazac interakcije u petlji:

S vremenom to stvara osjećaj razvijajućeg razumijevanja, omogućujući modelu da navigira složenim, višekoracima zadacima bez potrebe da čovjek stalno intervenira ili preoblikuje prompt.

Rukovanje načinima neuspjeha i samopopravkom

Autonomija Agentic RAG-a uključuje i robusne mehanizme samopopravka. Kada sustav naiđe na slijepa crijeva—poput dohvaćanja irelevantnih dokumenata ili susretanja s neispravnim upitima—može:

Taj iterativni i dinamični pristup omogućuje modelu kontinuirano poboljšanje, osiguravajući da nije samo jednokratni sustav već sustav koji uči iz svojih pogrešaka tijekom određene sesije.

Self Correction Mechanism

Granice agencije

Unatoč svojoj autonomiji unutar zadatka, Agentic RAG nije analogan Općoj umjetnoj inteligenciji. Njegove “agentne” sposobnosti ograničene su na alate, izvore podataka i politike koje su osigurali ljudski programeri. Ne može izumiti vlastite alate niti izaći izvan granica domena koje su postavljene. Umjesto toga, izvrsno orkestrira resurse koji su mu dostupni. Ključne razlike u odnosu na naprednije oblike AI uključuju:

  1. Domen-specifična autonomija: Agentic RAG sustavi usmjereni su na postizanje korisnički definiranh ciljeva unutar poznate domene, koristeći strategije poput prepisivanja upita ili odabira alata kako bi poboljšali ishode.
  2. Ovisnost o infrastrukturi: Sposobnosti sustava ovise o alatima i podacima koje integriraju programeri. Ne može nadmašiti te granice bez ljudske intervencije.
  3. Poštovanje zaštitnih mjera: Etičke smjernice, pravila usklađenosti i poslovne politike ostaju izuzetno važne. Sloboda agenta uvijek je ograničena sigurnosnim mjerama i mehanizmima nadzora (nadamo se).

Praktični slučajevi upotrebe i vrijednost

Agentic RAG dolazi do izražaja u scenarijima koji zahtijevaju iterativno sužavanje i preciznost:

  1. Okruženja s prioritetom na ispravnost: U provjerama usklađenosti, regulatornim analizama ili pravnim istraživanjima, agentni model može višestruko provjeravati činjenice, konzultirati više izvora i prepisivati upite dok ne proizvede temeljito verificiran odgovor.
  2. Složene interakcije s bazama podataka: Kada se radi o strukturiranim podacima gdje upiti često mogu ne uspjeti ili trebati prilagodbu, sustav može autonomno suziti svoje upite koristeći Azure SQL ili Microsoft Fabric OneLake, osiguravajući da konačno dohvaćanje odgovara korisničkoj namjeri.
  3. Produženi radni tokovi: Duže sesije mogu se razvijati kako nove informacije izlaze na vidjelo. Agentic RAG može kontinuirano integrirati nove podatke, mijenjajući strategije kako bolje razumije prostor problema.

Upravljanje, transparentnost i povjerenje

Kako sustavi postaju autonomniji u svom rezoniranju, upravljanje i transparentnost su ključni:

Imati alate koji pružaju jasan zapis radnji je esencijalno. Bez njih, debugiranje višekorakog procesa može biti vrlo teško. Pogledajte sljedeći primjer iz Literal AI (tvrtke iza Chainlit) za Agent run:

AgentRunExample

Zaključak

Agentic RAG predstavlja prirodnu evoluciju u načinu na koji AI sustavi rukuju složenim, podatkovno intenzivnim zadacima. Usvajanjem obrasca interakcije u petlji, autonomnim odabirom alata i sužavanjem upita dok se ne postigne visokokvalitetan rezultat, sustav prelazi iz statičnog praćenja promptova u prilagodljivijeg, kontekstno osviještenog donositelja odluka. Iako i dalje ograničene ljudski definiranim infrastrukturama i etičkim smjernicama, ove agentne sposobnosti omogućuju bogatije, dinamičnije i konačno korisnije AI interakcije za poduzeća i krajnje korisnike.

Imaš li još pitanja o Agentic RAG-u?

Pridružite se Microsoft Foundry Discord kako biste susreli druge učenike, prisustvovali konzultacijama i dobili odgovore na svoja pitanja o AI agentima.

Dodatni resursi

Akademski radovi

Prethodna lekcija

Obrazac dizajna za korištenje alata

Sljedeća lekcija

Izgradnja pouzdanih AI agenata


Izjava o odricanju odgovornosti:
Ovaj dokument preveden je korištenjem AI servisa za prevođenje Co-op Translator (https://github.com/Azure/co-op-translator). Iako nastojimo postići točnost, imajte na umu da automatski prijevodi mogu sadržavati pogreške ili netočnosti. Izvorni dokument na izvornom jeziku treba smatrati autoritativnim izvorom. Za kritične informacije preporučuje se profesionalni ljudski prijevod. Ne snosimo odgovornost za bilo kakve nesporazume ili pogrešna tumačenja koja proizlaze iz uporabe ovog prijevoda.