ai-agents-for-beginners

Agentic RAG

(Klikkaa yllä olevaa kuvaa katsoaksesi tämän oppitunnin videon)

Agentic RAG

Tämä oppitunti tarjoaa kattavan yleiskatsauksen Agentic Retrieval-Augmented Generationiin (Agentic RAG), nousevaan tekoälyparadigmaan, jossa suuret kielimallit (LLM:t) suunnittelevat itsenäisesti seuraavat askeleensa samalla, kun ne hakevat tietoa ulkoisista lähteistä. Toisin kuin staattiset “haku ja luku” -mallit, Agentic RAG sisältää iteratiivisia kutsuja LLM:lle, joita vuorottelevat työkalujen tai toimintojen kutsut ja jäsennellyt tulosteet. Järjestelmä arvioi tuloksia, tarkentaa kyselyitä, käyttää tarvittaessa lisätyökaluja ja jatkaa tätä sykliä, kunnes saavutetaan tyydyttävä ratkaisu.

Johdanto

Tässä oppitunnissa käsitellään:

Oppimistavoitteet

Oppitunnin jälkeen osaat/ymmärrät:

Mikä on Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) on nouseva tekoälyparadigma, jossa suuret kielimallit (LLM:t) suunnittelevat itsenäisesti seuraavat askeleensa samalla, kun ne hakevat tietoa ulkoisista lähteistä. Toisin kuin staattiset “haku ja luku” -mallit, Agentic RAG sisältää iteratiivisia kutsuja LLM:lle, joita vuorottelevat työkalujen tai toimintojen kutsut ja jäsennellyt tulosteet. Järjestelmä arvioi tuloksia, tarkentaa kyselyitä, käyttää tarvittaessa lisätyökaluja ja jatkaa tätä sykliä, kunnes saavutetaan tyydyttävä ratkaisu. Tämä iteratiivinen “maker-checker”-tyyli parantaa tarkkuutta, käsittelee virheellisiä kyselyitä ja varmistaa korkealaatuiset tulokset.

Järjestelmä hallitsee aktiivisesti omaa päättelyprosessiaan, kirjoittaa epäonnistuneet kyselyt uudelleen, valitsee erilaisia hakutapoja ja integroi useita työkaluja—kuten vektorihaun Azure AI Searchissa, SQL-tietokantoja tai mukautettuja API-rajapintoja—ennen lopullisen vastauksen antamista. Agenttijärjestelmän erottuva piirre on sen kyky hallita omaa päättelyprosessiaan. Perinteiset RAG-toteutukset luottavat ennalta määriteltyihin polkuihin, mutta agenttijärjestelmä päättää itsenäisesti askelten järjestyksen löytämänsä tiedon laadun perusteella.

Agentic Retrieval-Augmented Generationin (Agentic RAG) määrittely

Agentic Retrieval-Augmented Generation (Agentic RAG) on nouseva tekoälykehityksen paradigma, jossa LLM:t eivät ainoastaan hae tietoa ulkoisista tietolähteistä, vaan myös suunnittelevat itsenäisesti seuraavat askeleensa. Toisin kuin staattiset “haku ja luku” -mallit tai huolellisesti skriptatut kehotussekvenssit, Agentic RAG sisältää iteratiivisten LLM-kutsujen silmukan, jota vuorottelevat työkalujen tai toimintojen kutsut ja jäsennellyt tulosteet. Jokaisessa vaiheessa järjestelmä arvioi saatuja tuloksia, päättää, tarkentaako kyselyitä, käyttääkö lisätyökaluja ja jatkaa tätä sykliä, kunnes saavutetaan tyydyttävä ratkaisu.

Tämä iteratiivinen “maker-checker”-tyyli on suunniteltu parantamaan tarkkuutta, käsittelemään virheellisiä kyselyitä jäsenneltyihin tietokantoihin (esim. NL2SQL) ja varmistamaan tasapainoiset, korkealaatuiset tulokset. Sen sijaan, että järjestelmä luottaisi pelkästään huolellisesti suunniteltuihin kehotusketjuihin, se hallitsee aktiivisesti omaa päättelyprosessiaan. Se voi kirjoittaa epäonnistuneet kyselyt uudelleen, valita erilaisia hakutapoja ja integroida useita työkaluja—kuten vektorihaun Azure AI Searchissa, SQL-tietokantoja tai mukautettuja API-rajapintoja—ennen lopullisen vastauksen antamista. Tämä poistaa tarpeen monimutkaisille orkestrointikehyksille. Sen sijaan suhteellisen yksinkertainen silmukka “LLM-kutsu → työkalun käyttö → LLM-kutsu → …” voi tuottaa hienostuneita ja hyvin perusteltuja tuloksia.

Agentic RAG Core Loop

Päättelyprosessin hallinta

Agenttijärjestelmän erottuva piirre on sen kyky hallita omaa päättelyprosessiaan. Perinteiset RAG-toteutukset luottavat usein ihmisten ennalta määrittelemään polkuun: ajatusketjuun, joka määrittelee, mitä hakea ja milloin.
Mutta kun järjestelmä on aidosti agenttinen, se päättää sisäisesti, miten ongelmaa lähestytään. Se ei vain suorita skriptiä; se määrittää itsenäisesti askelten järjestyksen löytämänsä tiedon laadun perusteella.
Esimerkiksi, jos sitä pyydetään luomaan tuotelanseerausstrategia, se ei luota pelkästään kehotukseen, joka määrittelee koko tutkimus- ja päätöksentekotyönkulun. Sen sijaan agenttimalli päättää itsenäisesti:

  1. Hakea ajankohtaisia markkinatrendiraportteja Bing Web Groundingin avulla.
  2. Tunnistaa olennaisia kilpailijatietoja Azure AI Searchin avulla.
  3. Yhdistää historiallisia sisäisiä myyntimittareita Azure SQL Databasea käyttäen.
  4. Synteettisesti analysoida löydökset yhtenäiseksi strategiaksi Azure OpenAI Servicen avulla.
  5. Arvioida strategiaa aukkojen tai epäjohdonmukaisuuksien varalta, mikä voi johtaa uuteen hakukierrokseen.

Kaikki nämä vaiheet—kyselyiden tarkentaminen, lähteiden valinta, iterointi, kunnes vastaus on “tyydyttävä”—päätetään mallin toimesta, ei ihmisen ennalta skriptamana.

Iteratiiviset silmukat, työkalujen integrointi ja muisti

Tool Integration Architecture

Agenttijärjestelmä perustuu silmukkamaiseen vuorovaikutusmalliin:

Ajan myötä tämä luo tunteen kehittyvästä ymmärryksestä, mikä mahdollistaa mallin navigoida monimutkaisissa, monivaiheisissa tehtävissä ilman, että ihmisen tarvitsee jatkuvasti puuttua asiaan tai muokata kehotusta.

Virhetilanteiden käsittely ja itsekorjaus

Agentic RAG:n autonomia sisältää myös vahvat itsekorjausmekanismit. Kun järjestelmä kohtaa umpikujaan johtavia tilanteita—kuten epäolennaisten dokumenttien hakemista tai virheellisiä kyselyitä—se voi:

Tämä iteratiivinen ja dynaaminen lähestymistapa mahdollistaa mallin jatkuvan parantamisen, varmistaen, että se ei ole vain kertakäyttöinen järjestelmä, vaan oppii virheistään kyseisen istunnon aikana.

Self Correction Mechanism

Toimintavapauden rajat

Vaikka Agentic RAG on autonominen tehtävänsä sisällä, se ei ole verrattavissa yleiseen tekoälyyn (Artificial General Intelligence). Sen “agenttiset” kyvyt rajoittuvat ihmisten kehittämiin työkaluihin, tietolähteisiin ja käytäntöihin. Se ei voi keksiä omia työkalujaan tai ylittää sille asetettuja toimialarajoja. Sen sijaan se loistaa dynaamisesti orkestroimalla käytettävissä olevia resursseja.
Keskeiset erot kehittyneempiin tekoälymuotoihin ovat:

  1. Toimialakohtainen autonomia: Agentic RAG -järjestelmät keskittyvät käyttäjän määrittämien tavoitteiden saavuttamiseen tunnetulla toimialalla, hyödyntäen strategioita, kuten kyselyiden uudelleenkirjoittamista tai työkalujen valintaa tulosten parantamiseksi.
  2. Infrastruktuuririippuvuus: Järjestelmän kyvyt riippuvat kehittäjien integroimista työkaluista ja tiedoista. Se ei voi ylittää näitä rajoja ilman ihmisen väliintuloa.
  3. Turvamekanismien kunnioittaminen: Eettiset ohjeet, sääntöjen noudattaminen ja liiketoimintakäytännöt ovat edelleen erittäin tärkeitä. Agentin vapaus on aina rajoitettu turvallisuusmekanismeilla ja valvontajärjestelmillä (toivottavasti?).

Käytännön käyttötapaukset ja arvo

Agentic RAG loistaa tilanteissa, jotka vaativat iteratiivista tarkentamista ja tarkkuutta:

  1. Tarkkuutta vaativat ympäristöt: Säädösten tarkastuksissa, sääntelyanalyysissä tai oikeudellisessa tutkimuksessa agenttimalli voi toistuvasti tarkistaa faktoja, konsultoida useita lähteitä ja kirjoittaa kyselyitä uudelleen, kunnes se tuottaa perusteellisesti tarkistetun vastauksen.
  2. Monimutkaiset tietokantainteraktiot: Kun käsitellään jäsenneltyjä tietoja, joissa kyselyt voivat usein epäonnistua tai vaatia säätöä, järjestelmä voi itsenäisesti tarkentaa kyselyitään Azure SQL:n tai Microsoft Fabric OneLaken avulla varmistaen, että lopullinen haku vastaa käyttäjän tarkoitusta.
  3. Laajennetut työnkulut: Pidemmät istunnot voivat kehittyä, kun uutta tietoa tulee esiin. Agentic RAG voi jatkuvasti sisällyttää uutta dataa, muuttaa strategioita ja oppia lisää ongelma-alueesta.

Hallinta, läpinäkyvyys ja luottamus

Kun nämä järjestelmät tulevat yhä itsenäisemmiksi päättelyssään, hallinta ja läpinäkyvyys ovat ratkaisevan tärkeitä:

Työkalut, jotka tarjoavat selkeän toimintarekisterin, ovat välttämättömiä. Ilman niitä monivaiheisen prosessin virheenk Toteuta Retrieval Augmented Generation (RAG) Azure OpenAI -palvelulla: Opi käyttämään omaa dataasi Azure OpenAI -palvelun kanssa. Tämä Microsoft Learn -moduuli tarjoaa kattavan oppaan RAG:n toteuttamiseen

Akateemiset artikkelit

Edellinen oppitunti

Työkalujen käyttö -suunnittelumalli

Seuraava oppitunti

Luotettavien tekoälyagenttien rakentaminen


Vastuuvapauslauseke:
Tämä asiakirja on käännetty käyttämällä tekoälypohjaista käännöspalvelua Co-op Translator. Vaikka pyrimme tarkkuuteen, huomioithan, että automaattiset käännökset voivat sisältää virheitä tai epätarkkuuksia. Alkuperäinen asiakirja sen alkuperäisellä kielellä tulisi pitää ensisijaisena lähteenä. Kriittisen tiedon osalta suositellaan ammattimaista ihmiskäännöstä. Emme ole vastuussa väärinkäsityksistä tai virhetulkinnoista, jotka johtuvat tämän käännöksen käytöstä.