ai-agents-for-beginners

Agentic RAG

(Kliknite na zgornjo sliko za ogled videa te lekcije)

Agentic RAG

Ta lekcija ponuja celovit pregled Agentic Retrieval-Augmented Generation (Agentic RAG), nastajajočega AI paradigme, kjer veliki jezikovni modeli (LLM) samostojno načrtujejo svoje naslednje korake, hkrati pa pridobivajo informacije iz zunanjih virov. V nasprotju z nestatičnimi vzorci iskanja in branja, Agentic RAG vključuje iterativne klice LLM, prepletajoče se s klici orodij ali funkcij ter strukturiranimi izhodi. Sistem ocenjuje rezultate, izpopolnjuje poizvedbe, po potrebi kliče dodatna orodja in nadaljuje ta cikel, dokler ne doseže zadovoljive rešitve.

Uvod

V tej lekciji boste obravnavali

Cilji učenja

Po zaključku te lekcije boste znali/razumeli:

Kaj je Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) je nastajajoča paradigma AI, kjer veliki jezikovni modeli (LLM) samostojno načrtujejo svoje naslednje korake medtem ko pridobivajo informacije iz zunanjih virov. V nasprotju z nestatičnimi vzorci iskanja in branja, Agentic RAG vključuje iterativne klice LLM, prepletajoče se z orodji ali klici funkcij ter strukturiranimi izhodi. Sistem ocenjuje rezultate, izpopolnjuje poizvedbe, po potrebi kliče dodatna orodja in nadaljuje ta cikel, dokler ne doseže zadovoljive rešitve. Ta iterativni “maker-checker” slog izboljšuje pravilnost, obravnava nepravilne poizvedbe in zagotavlja visokokakovostne rezultate.

Sistem aktivno prevzema nadzor nad svojim procesom sklepanja, prepisuje neuspešne poizvedbe, izbira različne metode iskanja in integrira več orodij — kot so vektorsko iskanje v Azure AI Search, SQL baze podatkov ali lastne API-je — preden zaključi svoj odgovor. Kar razlikuje agentni sistem, je njegova sposobnost, da prevzame nadzor nad procesom sklepanja. Tradicionalne implementacije RAG se zanašajo na predhodno določene poti, medtem ko agentni sistem samostojno določa zaporedje korakov glede na kakovost najdenih informacij.

Določitev Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) je nastajajoča paradigma razvoja AI, kjer LLM ne le izvleče informacije iz zunanjih podatkovnih virov, temveč tudi samostojno načrtuje svoje naslednje korake. V nasprotju z nestatičnimi vzorci iskanja in branja ali skrbno načrtovanimi zaporedji pozivov, Agentic RAG vključuje zanko iterativnih klicev LLM, prepletenih s klici orodij ali funkcij in strukturiranimi izhodi. Pri vsakem koraku sistem ocenjuje rezultate, odloča, ali bo izpopolnil poizvedbe, kliče dodatna orodja po potrebi in nadaljuje ta cikel, dokler ne doseže zadovoljive rešitve.

Ta iterativni “maker-checker” način delovanja je zasnovan za izboljšanje pravilnosti, obravnavanje nepravilnih poizvedb do strukturiranih baz podatkov (npr. NL2SQL) in zagotavljanje uravnoteženih, visokokakovostnih rezultatov. Namesto da bi se zanašal zgolj na skrbno zasnovane verige pozivov, sistem aktivno prevzema nadzor nad svojim procesom sklepanja. Lahko prepiše poizvedbe, ki niso uspešne, izbere različne metode iskanja in integrira več orodij — kot so vektorsko iskanje v Azure AI Search, SQL baze podatkov ali lastne API-je — preden zaključi svoj odgovor. To odpravlja potrebo po zapletenih orodjih za orkestracijo. Namesto tega lahko relativno preprosta zanka “klic LLM → uporaba orodja → klic LLM → …” prinese sofisticirane in dobro utemeljene izhode.

Agentic RAG Core Loop

Prevzem nadzora nad procesom sklepanja

Razpoznavna lastnost, ki sistem naredi “agentnega”, je njegova sposobnost, da prevzame nadzor nad svojim procesom sklepanja. Tradicionalne implementacije RAG pogosto temeljijo na tem, da ljudje vnaprej določijo pot modela: verigo razmišljanja, ki določa, kaj iskati in kdaj. Ko pa je sistem resnično agenten, se notranje odloči, kako se lotiti problema. Ne izvaja samo skripte; samostojno določa zaporedje korakov glede na kakovost najdenih informacij. Na primer, če ga prosijo, naj ustvari strategijo lansiranja izdelka, se ne zanaša zgolj na poziv, ki opisuje celoten raziskovalni in odločilni proces. Namesto tega agentni model samostojno odloči, da:

  1. Pridobi trenutno poročilo o tržnih trendih s pomočjo Bing Web Grounding
  2. Identificira relevantne podatke o konkurentih z uporabo Azure AI Search.
  3. Poveže zgodovinske notranje prodajne metrike z uporabo Azure SQL Database.
  4. Sintetizira ugotovitve v skladno strategijo, orkestrirano preko Azure OpenAI Service.
  5. Ocenjuje strategijo glede vrzeli ali neskladnosti in po potrebi sproži nov krog iskanja. Vsi ti koraki — izpopolnjevanje poizvedb, izbiranje virov, iteriranje dokler ni “zadovoljen” z odgovorom — so odločitve modela, ne vnaprej narejene s strani človeka.

Iterativne zanke, integracija orodij in pomnjenje

Tool Integration Architecture

Agentni sistem se zanaša na vzorec interakcije z zanko:

Sčasoma to ustvarja občutek razvijajočega razumevanja, kar modelu omogoča navigacijo skozi kompleksne, večstopenjske naloge brez potrebe po stalni človeški intervenciji ali spreminjanju pozivov.

Obravnava načinov napak in samopopravki

Avtonomija Agentic RAG vključuje tudi robustne mehanizme samopopravljanja. Ko sistem naleti na slepe ulice — kot so pridobivanje nepomembnih dokumentov ali srečevanje nepravilnih poizvedb — lahko:

Ta iterativni in dinamični pristop omogoča modelu stalno izboljševanje, s čimer zagotavlja, da ni le sistem za enkratno rabo, ampak se uči iz svojih napak med posamezno sejo.

Self Correction Mechanism

Meje agentnosti

Kljub svoji avtonomiji znotraj naloge Agentic RAG ni enakovreden umetni splošni inteligenci. Njegove “agentne” zmožnosti so omejene na orodja, podatkovne vire in politike, ki so jih določili ljudje razvijalci. Ne more izumiti lastnih orodij ali preseči domennih mej, ki so bile določene. Namesto tega odlično orkestrira razpoložljive vire. Ključne razlike od bolj naprednih oblik AI so:

  1. Domeninsko specifična avtonomija: Agentic RAG sistemi se osredotočajo na doseganje ciljev, določenih s strani uporabnika, znotraj znane domene, z uporabo strategij, kot je prepisovanje poizvedb ali izbira orodij za izboljšanje rezultatov.
  2. Odvisnost od infrastrukture: Zmožnosti sistema so odvisne od orodij in podatkov, ki jih integrirajo razvijalci. Teh meja ne more preseči brez človeške intervencije.
  3. Spoštovanje varnostnih omejitev: Etična priporočila, pravila skladnosti in poslovne politike ostajajo zelo pomembni. Svoboda agenta je vedno omejena s varnostnimi ukrepi in mehanizmi nadzora (upajmo da?).

Praktični primeri uporabe in vrednost

Agentic RAG izstopa v scenarijih, ki zahtevajo iterativno izpopolnjevanje in natančnost:

  1. Okolja, ki dajejo prednost pravilnosti: Pri skladnostnih pregledih, regulativnih analizah ali pravnem raziskovanju lahko agentni model večkrat preveri dejstva, povpraša različne vire in prepiše poizvedbe, dokler ne zagotovi temeljito preverjenega odgovora.
  2. Kompleksne interakcije z bazami podatkov: Ko gre za strukturirane podatke, kjer poizvedbe pogosto ne uspejo ali jih je treba prilagoditi, lahko sistem samostojno izpopolni svoje poizvedbe z uporabo Azure SQL ali Microsoft Fabric OneLake, pri čemer zagotovi, da je končni rezultat usklajen z namenom uporabnika.
  3. Daljši delovni procesi: Daljša trajanja sej se lahko razvijajo, ko se pojavijo nove informacije. Agentic RAG lahko stalno vključuje nove podatke in spreminja strategije, ko se nauči več o problematičnem prostoru.

Upravljanje, preglednost in zaupanje

Ko ti sistemi postajajo bolj avtonomni v svojem sklepanju, so upravljanje in preglednost ključni:

Imeti orodja, ki zagotavljajo jasen zapis dejanj, je bistveno. Brez njih je odpravljanje napak v večstopenjskem postopku zelo težko. Oglejte si naslednji primer iz Literal AI (podjetja za Chainlit) za zagon agenta:

AgentRunExample

Zaključek

Agentic RAG predstavlja naravno evolucijo v načinu, kako AI sistemi obravnavajo kompleksne, podatkovno intenzivne naloge. Z uvedbo vzorca interakcije v zanki, samostojno izbiro orodij ter izpopolnjevanjem poizvedb do doseganja visokokakovostnega rezultata se sistem premakne onkraj statičnega sledenja pozivom v bolj prilagodljivega, kontekstno ozaveščenega odločevalca. Čeprav je še vedno omejen s človeško določenimi infrastrukturnimi in etičnimi smernicami, te agentne zmožnosti omogočajo bogatejše, bolj dinamične in končno bolj uporabne AI interakcije tako za podjetja kot končne uporabnike.

Imate več vprašanj o Agentic RAG?

Pridružite se Microsoft Foundry Discord, da se povežete z drugimi učenci, udeležite uradnih ur in dobite odgovore na vprašanja o AI agentih.

Dodatni viri

Akademske Objave

Prejšnja Lekcija

Oblika uporabe orodja

Naslednja Lekcija

Gradnja zanesljivih AI agentov


Omejitev odgovornosti: Ta dokument je bil preveden z uporabo storitve za avtomatski prevod Co-op Translator. Čeprav si prizadevamo za točnost, upoštevajte, da lahko avtomatski prevodi vsebujejo napake ali netočnosti. Izvirni dokument v njegovem izvor­nem jeziku velja za avtoritativni vir. Za pomembne informacije priporočamo strokovni človeški prevod. Za morebitna nesporazume ali napačne razlage, ki izhajajo iz uporabe tega prevoda, ne odgovarjamo.