ai-agents-for-beginners

Agentic RAG

(Kliknite na zgornjo sliko za ogled videoposnetka te lekcije)

Agentic RAG

Ta lekcija ponuja celovit pregled paradigme Agentic Retrieval-Augmented Generation (Agentic RAG), novega pristopa v umetni inteligenci, kjer veliki jezikovni modeli (LLM) samostojno načrtujejo svoje naslednje korake, medtem ko pridobivajo informacije iz zunanjih virov. Za razliko od statičnih vzorcev “pridobi nato preberi” Agentic RAG vključuje iterativne klice LLM, prepletene z uporabo orodij ali funkcij in strukturiranimi izhodi. Sistem ocenjuje rezultate, izpopolnjuje poizvedbe, po potrebi uporablja dodatna orodja in nadaljuje ta cikel, dokler ne doseže zadovoljive rešitve.

Uvod

Ta lekcija bo obravnavala:

Cilji učenja

Po zaključku te lekcije boste znali/razumeli:

Kaj je Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) je nova paradigma v umetni inteligenci, kjer veliki jezikovni modeli (LLM) samostojno načrtujejo svoje naslednje korake, medtem ko pridobivajo informacije iz zunanjih virov. Za razliko od statičnih vzorcev “pridobi nato preberi” Agentic RAG vključuje iterativne klice LLM, prepletene z uporabo orodij ali funkcij in strukturiranimi izhodi. Sistem ocenjuje rezultate, izpopolnjuje poizvedbe, po potrebi uporablja dodatna orodja in nadaljuje ta cikel, dokler ne doseže zadovoljive rešitve. Ta iterativni pristop “maker-checker” izboljšuje pravilnost, obravnava napačne poizvedbe in zagotavlja visokokakovostne rezultate.

Sistem aktivno prevzema odgovornost za svoj proces razmišljanja, prepisuje neuspele poizvedbe, izbira različne metode pridobivanja in integrira več orodij—kot so iskanje vektorjev v Azure AI Search, SQL baze podatkov ali prilagojeni API-ji—preden dokonča svoj odgovor. Ključna značilnost agentičnega sistema je njegova sposobnost, da prevzame odgovornost za svoj proces razmišljanja. Tradicionalne implementacije RAG se zanašajo na vnaprej določene poti, medtem ko agentični sistem samostojno določa zaporedje korakov na podlagi kakovosti najdenih informacij.

Definicija Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) je nova paradigma v razvoju umetne inteligence, kjer LLM ne le pridobivajo informacije iz zunanjih virov podatkov, temveč tudi samostojno načrtujejo svoje naslednje korake. Za razliko od statičnih vzorcev “pridobi nato preberi” ali skrbno skriptiranih zaporedij pozivov Agentic RAG vključuje zanko iterativnih klicev LLM, prepletenih z uporabo orodij ali funkcij in strukturiranimi izhodi. Na vsakem koraku sistem ocenjuje pridobljene rezultate, se odloča, ali bo izpopolnil poizvedbe, po potrebi uporablja dodatna orodja in nadaljuje ta cikel, dokler ne doseže zadovoljive rešitve.

Ta iterativni pristop “maker-checker” je zasnovan za izboljšanje pravilnosti, obravnavo napačnih poizvedb v strukturirane baze podatkov (npr. NL2SQL) in zagotavljanje uravnoteženih, visokokakovostnih rezultatov. Namesto da bi se zanašal zgolj na skrbno zasnovane verige pozivov, sistem aktivno prevzema odgovornost za svoj proces razmišljanja. Lahko prepiše neuspele poizvedbe, izbere različne metode pridobivanja in integrira več orodij—kot so iskanje vektorjev v Azure AI Search, SQL baze podatkov ali prilagojeni API-ji—preden dokonča svoj odgovor. To odpravlja potrebo po preveč zapletenih orkestracijskih okvirih. Namesto tega lahko relativno preprosta zanka “klic LLM → uporaba orodja → klic LLM → …” prinese prefinjene in dobro utemeljene rezultate.

Agentic RAG Core Loop

Prevzemanje odgovornosti za proces razmišljanja

Ključna značilnost, ki naredi sistem “agentičen”, je njegova sposobnost, da prevzame odgovornost za svoj proces razmišljanja. Tradicionalne implementacije RAG se pogosto zanašajo na ljudi, da vnaprej določijo pot za model: verigo misli, ki določa, kaj pridobiti in kdaj. Ko pa je sistem resnično agentičen, se sam odloča, kako pristopiti k problemu. Ne izvaja le skripta; samostojno določa zaporedje korakov na podlagi kakovosti najdenih informacij. Na primer, če je sistemu naročeno, naj ustvari strategijo lansiranja izdelka, se ne zanaša zgolj na poziv, ki natančno določa celoten raziskovalni in odločitveni delovni tok. Namesto tega agentični model samostojno odloča:

  1. Pridobiti trenutna poročila o tržnih trendih z uporabo Bing Web Grounding.
  2. Prepoznati ustrezne podatke o konkurentih z uporabo Azure AI Search.
  3. Povezati zgodovinske notranje prodajne metrike z uporabo Azure SQL Database.
  4. Sintetizirati ugotovitve v kohezivno strategijo, orkestrirano prek Azure OpenAI Service.
  5. Oceniti strategijo glede vrzeli ali neskladnosti in po potrebi sprožiti nov krog pridobivanja. Vsi ti koraki—izpopolnjevanje poizvedb, izbira virov, iteracija, dokler ni “zadovoljen” z odgovorom—so odločitve modela, ne vnaprej skriptirane odločitve človeka.

Iterativne zanke, integracija orodij in spomin

Tool Integration Architecture

Agentični sistem se zanaša na vzorec interakcije v zanki:

Sčasoma to ustvari občutek razvijajočega se razumevanja, kar omogoča modelu, da se spopada s kompleksnimi, večstopenjskimi nalogami brez potrebe po stalnem človeškem posredovanju ali preoblikovanju poziva.

Obravnavanje načinov neuspeha in samopopravljanje

Avtonomija Agentic RAG vključuje tudi robustne mehanizme samopopravljanja. Ko sistem naleti na slepe ulice—na primer pridobivanje nepomembnih dokumentov ali nalet na napačne poizvedbe—lahko:

Ta iterativen in dinamičen pristop omogoča modelu, da se nenehno izboljšuje, kar zagotavlja, da ni le sistem za enkratno uporabo, temveč tak, ki se uči iz svojih napak med posamezno sejo.

Self Correction Mechanism

Meje agentnosti

Kljub svoji avtonomiji znotraj naloge Agentic RAG ni enakovreden splošni umetni inteligenci. Njegove “agentične” sposobnosti so omejene na orodja, vire podatkov in politike, ki jih določijo človeški razvijalci. Ne more si izmisliti lastnih orodij ali preseči meja domen, ki so bile določene. Namesto tega odlično obvladuje dinamično orkestracijo razpoložljivih virov. Ključne razlike od bolj naprednih oblik umetne inteligence vključujejo:

  1. Avtonomija, specifična za domeno: Sistemi Agentic RAG so osredotočeni na doseganje ciljev, ki jih določi uporabnik, znotraj znane domene, pri čemer uporabljajo strategije, kot sta prepisovanje poizvedb ali izbira orodij za izboljšanje rezultatov.
  2. Odvisnost od infrastrukture: Zmožnosti sistema so odvisne od orodij in podatkov, ki jih integrirajo razvijalci. Brez človeškega posredovanja ne more preseči teh meja.
  3. Spoštovanje varoval: Etične smernice, pravila skladnosti in poslovne politike ostajajo zelo pomembne. Svoboda agenta je vedno omejena z varnostnimi ukrepi in mehanizmi nadzora (upajmo?).

Praktični primeri uporabe in vrednost

Agentic RAG izstopa v scenarijih, ki zahtevajo iterativno izpopolnjevanje in natančnost:

  1. Okolja, kjer je pravilnost na prvem mestu: Pri preverjanju skladnosti, regulativnih analizah ali pravnih raziskavah lahko agentični model večkrat preveri dejstva, se posvetuje z več viri in prepiše poizvedbe, dokler ne poda temeljito preverjenega odgovora.
  2. Kompleksne interakcije z bazami podatkov: Pri delu s strukturiranimi podatki, kjer poizvedbe pogosto ne uspejo ali potrebujejo prilagoditev, lahko sistem samostojno izpopolni svoje poizvedbe z uporabo Azure SQL ali Microsoft Fabric OneLake, kar zagotavlja, da končno pridobivanje ustreza uporabnikovemu namenu.
  3. Razširjeni delovni tokovi: Daljše seje se lahko razvijajo, ko se pojavijo nove informacije. Agentic RAG lahko nenehno vključuje nove podatke in spreminja strategije, ko se več nauči o problematičnem prostoru.

Upravljanje, preglednost in zaupanje

Ker ti sistemi postajajo bolj avtonomni v svojem razmišljanju, so upravljanje in preglednost ključnega pomena:

Imeti orodja, ki zagotavljajo jasen zapis dejanj, je bistveno. Brez njih je odpravljanje napak v večstopenjskem procesu lahko zelo težavno. Oglejte si naslednji primer iz podjetja Literal AI (podjetje za Chainlit) za zagon agenta:

AgentRunExample

AgentRunExample2

Zaključek

Agentic RAG predstavlja naravno evolucijo v tem, kako sistemi umetne inteligence obravnavajo kompleksne, podatkovno intenzivne naloge. S sprejetjem vzorca interakcije v zanki, samostojno izbiro orodij in izpopolnjevanjem poizvedb, dokler ne doseže visokokakovostnega rezultata, sistem presega statično sledenje pozivom in postane bolj prilagodljiv, kontekstno zavedajoč se odločevalec. Čeprav je še vedno omejen z infrastrukturo, ki jo določijo ljudje, in etičnimi smernicami, te agentične sposobnosti omogočajo bogatejše, bolj din Implementacija pridobivanja z izboljšano generacijo (RAG) z Azure OpenAI Service: Naučite se uporabljati svoje podatke z Azure OpenAI Service. Ta modul Microsoft Learn ponuja celovit vodnik za implementacijo RAG

Akademski članki

Prejšnja lekcija

Vzorec oblikovanja uporabe orodij

Naslednja lekcija

Gradnja zaupanja vrednih AI agentov


Omejitev odgovornosti:
Ta dokument je bil preveden z uporabo storitve za prevajanje z umetno inteligenco Co-op Translator. Čeprav si prizadevamo za natančnost, vas prosimo, da upoštevate, da lahko avtomatizirani prevodi vsebujejo napake ali netočnosti. Izvirni dokument v njegovem izvirnem jeziku je treba obravnavati kot avtoritativni vir. Za ključne informacije priporočamo profesionalni človeški prevod. Ne prevzemamo odgovornosti za morebitne nesporazume ali napačne razlage, ki bi nastale zaradi uporabe tega prevoda.