ai-agents-for-beginners

Agentic RAG

(Kliknite na zgornjo sliko za ogled videa te lekcije)

Agentic RAG

Ta lekcija ponuja celovit pregled paradigme Agentic Retrieval-Augmented Generation (Agentic RAG), novega pristopa v umetni inteligenci, kjer veliki jezikovni modeli (LLM) samostojno načrtujejo svoje naslednje korake, medtem ko pridobivajo informacije iz zunanjih virov. Za razliko od statičnih vzorcev “pridobivanja in nato branja” Agentic RAG vključuje iterativne klice LLM, prepletene z uporabo orodij ali funkcij ter strukturiranimi izhodi. Sistem ocenjuje rezultate, izpopolnjuje poizvedbe, po potrebi uporablja dodatna orodja in nadaljuje ta cikel, dokler ne doseže zadovoljive rešitve.

Uvod

Ta lekcija bo obravnavala:

Cilji učenja

Po zaključku te lekcije boste znali/razumeli:

Kaj je Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) je nova paradigma v umetni inteligenci, kjer veliki jezikovni modeli (LLM) samostojno načrtujejo svoje naslednje korake, medtem ko pridobivajo informacije iz zunanjih virov. Za razliko od statičnih vzorcev “pridobivanja in nato branja” Agentic RAG vključuje iterativne klice LLM, prepletene z uporabo orodij ali funkcij ter strukturiranimi izhodi. Sistem ocenjuje rezultate, izpopolnjuje poizvedbe, po potrebi uporablja dodatna orodja in nadaljuje ta cikel, dokler ne doseže zadovoljive rešitve. Ta iterativni pristop “maker-checker” izboljšuje pravilnost, obravnava nepravilne poizvedbe in zagotavlja visokokakovostne rezultate.

Sistem aktivno upravlja svoj proces razmišljanja, prepisuje neuspele poizvedbe, izbira različne metode pridobivanja in integrira več orodij—kot so iskanje vektorjev v Azure AI Search, SQL baze podatkov ali prilagojeni API-ji—preden dokonča svoj odgovor. Posebna značilnost agentnega sistema je njegova sposobnost samostojnega upravljanja procesa razmišljanja. Tradicionalne implementacije RAG se zanašajo na vnaprej določene poti, medtem ko agentni sistem samostojno določa zaporedje korakov na podlagi kakovosti najdenih informacij.

Definicija Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) je nova paradigma v razvoju umetne inteligence, kjer LLM ne le pridobivajo informacije iz zunanjih virov podatkov, temveč tudi samostojno načrtujejo svoje naslednje korake. Za razliko od statičnih vzorcev “pridobivanja in nato branja” ali skrbno skriptiranih zaporedij pozivov Agentic RAG vključuje zanko iterativnih klicev LLM, prepletenih z uporabo orodij ali funkcij ter strukturiranimi izhodi. Na vsakem koraku sistem ocenjuje pridobljene rezultate, odloča, ali je treba poizvedbe izpopolniti, po potrebi uporablja dodatna orodja in nadaljuje ta cikel, dokler ne doseže zadovoljive rešitve.

Ta iterativni pristop “maker-checker” je zasnovan za izboljšanje pravilnosti, obravnavo nepravilnih poizvedb v strukturirane baze podatkov (npr. NL2SQL) in zagotavljanje uravnoteženih, visokokakovostnih rezultatov. Namesto da se zanaša zgolj na skrbno zasnovane verige pozivov, sistem aktivno upravlja svoj proces razmišljanja. Lahko prepiše neuspele poizvedbe, izbere različne metode pridobivanja in integrira več orodij—kot so iskanje vektorjev v Azure AI Search, SQL baze podatkov ali prilagojeni API-ji—preden dokonča svoj odgovor. To odpravlja potrebo po preveč kompleksnih orkestracijskih okvirih. Namesto tega lahko relativno preprosta zanka “klic LLM → uporaba orodja → klic LLM → …” prinese sofisticirane in dobro utemeljene izhode.

Agentic RAG Core Loop

Samostojno upravljanje procesa razmišljanja

Posebna značilnost, ki sistem opredeljuje kot “agentni”, je njegova sposobnost samostojnega upravljanja procesa razmišljanja. Tradicionalne implementacije RAG se pogosto zanašajo na ljudi, da vnaprej določijo pot za model: verigo razmišljanja, ki določa, kaj pridobiti in kdaj. Ko pa je sistem resnično agentni, samostojno odloča, kako pristopiti k problemu. Ne izvaja zgolj skripta; samostojno določa zaporedje korakov na podlagi kakovosti najdenih informacij. Na primer, če je sistemu naročeno, da ustvari strategijo lansiranja izdelka, se ne zanaša zgolj na poziv, ki podrobno opisuje celoten raziskovalni in odločevalni delovni tok. Namesto tega agentni model samostojno odloča:

  1. Pridobiti poročila o trenutnih tržnih trendih z uporabo Bing Web Grounding.
  2. Identificirati ustrezne podatke o konkurentih z uporabo Azure AI Search.
  3. Povezati zgodovinske notranje prodajne metrike z uporabo Azure SQL Database.
  4. Sintetizirati ugotovitve v kohezivno strategijo, orkestrirano prek Azure OpenAI Service.
  5. Oceniti strategijo glede vrzeli ali neskladnosti, kar lahko sproži nov krog pridobivanja podatkov, če je potrebno.

Vsi ti koraki—izpopolnjevanje poizvedb, izbira virov, iteracija, dokler ni dosežen “zadovoljiv” odgovor—so odločitve modela, ne vnaprej skriptirane s strani človeka.

Iterativne zanke, integracija orodij in spomin

Tool Integration Architecture

Agentni sistem se zanaša na vzorec interakcije v zanki:

Sčasoma to ustvari občutek razvijajočega se razumevanja, kar omogoča modelu, da navigira skozi kompleksne, večstopenjske naloge brez potrebe po stalnem človeškem posredovanju ali preoblikovanju poziva.

Obravnava načinov neuspeha in samopopravljanje

Avtonomija Agentic RAG vključuje tudi robustne mehanizme samopopravljanja. Ko sistem naleti na slepe ulice—kot je pridobivanje nerelevantnih dokumentov ali nepravilne poizvedbe—lahko:

Ta iterativen in dinamičen pristop omogoča modelu, da se nenehno izboljšuje, kar zagotavlja, da ni zgolj sistem za enkratno uporabo, temveč takšen, ki se uči iz svojih napak med določeno sejo.

Self Correction Mechanism

Meje avtonomije

Kljub svoji avtonomiji znotraj naloge Agentic RAG ni enakovreden umetni splošni inteligenci. Njegove “agentne” sposobnosti so omejene na orodja, vire podatkov in politike, ki jih zagotavljajo človeški razvijalci. Ne more si izmisliti svojih orodij ali preseči meja, ki so bile določene. Namesto tega odlično obvladuje dinamično orkestracijo razpoložljivih virov. Ključne razlike od bolj naprednih oblik umetne inteligence vključujejo:

  1. Avtonomija, specifična za domeno: Sistemi Agentic RAG so osredotočeni na doseganje ciljev, ki jih določi uporabnik, znotraj znane domene, pri čemer uporabljajo strategije, kot so prepisovanje poizvedb ali izbira orodij za izboljšanje rezultatov.
  2. Odvisnost od infrastrukture: Zmožnosti sistema so odvisne od orodij in podatkov, ki jih integrirajo razvijalci. Brez človeškega posredovanja ne more preseči teh meja.
  3. Spoštovanje varoval: Etične smernice, pravila skladnosti in poslovne politike ostajajo zelo pomembne. Svoboda agenta je vedno omejena z varnostnimi ukrepi in mehanizmi nadzora (upajmo?).

Praktični primeri uporabe in vrednost

Agentic RAG izstopa v scenarijih, ki zahtevajo iterativno izpopolnjevanje in natančnost:

  1. Okolja, kjer je pravilnost na prvem mestu: Pri preverjanju skladnosti, regulativni analizi ali pravnih raziskavah lahko agentni model večkrat preveri dejstva, konzultira več virov in prepiše poizvedbe, dokler ne poda temeljito preverjenega odgovora.
  2. Kompleksne interakcije z bazami podatkov: Pri delu s strukturiranimi podatki, kjer poizvedbe pogosto ne uspejo ali potrebujejo prilagoditev, lahko sistem samostojno izpopolni svoje poizvedbe z uporabo Azure SQL ali Microsoft Fabric OneLake, kar zagotavlja, da končno pridobivanje ustreza namenu uporabnika.
  3. Podaljšani delovni tokovi: Daljše seje se lahko razvijajo, ko se pojavijo nove informacije. Agentic RAG lahko nenehno vključuje nove podatke, spreminja strategije, ko se nauči več o problematičnem prostoru.

Upravljanje, transparentnost in zaupanje

Ker ti sistemi postajajo bolj avtonomni v svojem razmišljanju, so upravljanje in transparentnost ključnega pomena:

Imeti orodja, ki zagotavljajo jasen zapis dejanj, je bistveno. Brez njih je odpravljanje napak v večstopenjskem procesu lahko zelo težavno. Oglejte si naslednji primer iz Literal AI (podjetje za Chainlit) za izvedbo agenta:

AgentRunExample

Zaključek

Agentic RAG predstavlja naravno evolucijo v načinu, kako sistemi umetne inteligence obravnavajo kompleksne, podatkovno intenzivne naloge. Z uporabo vzorca interakcije v zanki, samostojno izbiro orodij in izpopolnjevanjem poizvedb, dokler ne doseže visokokakovostnega rezultata, sistem presega statično sledenje pozivom in postane bolj prilagodljiv ter zavedajoč se konteksta. Čeprav je še vedno omejen z infrastrukturo, ki jo določijo ljudje, in etičnimi smernicami, te agentne sposobnosti omogočajo bogatejše, bolj dinamične in na koncu bolj uporabne interakcije umetne inteligence za podjetja in končne uporab

Akademski članki

Prejšnja lekcija

Vzorec oblikovanja uporabe orodij

Naslednja lekcija

Gradnja zaupanja vrednih AI agentov


Omejitev odgovornosti:
Ta dokument je bil preveden z uporabo storitve AI za prevajanje Co-op Translator. Čeprav si prizadevamo za natančnost, vas prosimo, da upoštevate, da lahko avtomatizirani prevodi vsebujejo napake ali netočnosti. Izvirni dokument v njegovem maternem jeziku naj se šteje za avtoritativni vir. Za ključne informacije priporočamo profesionalni človeški prevod. Ne prevzemamo odgovornosti za morebitne nesporazume ali napačne razlage, ki bi nastale zaradi uporabe tega prevoda.