ai-agents-for-beginners

Agentic RAG

(Klikkaa yllä olevaa kuvaa nähdäksesi tämän oppitunnin videon)

Agentic RAG

Tämä oppitunti tarjoaa kattavan yleiskatsauksen Agentic Retrieval-Augmented Generation (Agentic RAG) -konseptista, joka on nouseva tekoälyn paradigma, jossa suuret kielimallit (LLM:t) suunnittelevat itsenäisesti seuraavat askeleensa samalla kun hakevat tietoa ulkoisista lähteistä. Toisin kuin staattiset haku-ja-lukeminen -mallit, Agentic RAG sisältää iteratiivisia kutsuja LLM:lle, joita vuorottelevat työkalujen tai funktioiden kutsut ja rakenteelliset tulokset. Järjestelmä arvioi tuloksia, tarkentaa kyselyitä, käyttää tarvittaessa lisätyökaluja ja jatkaa tätä sykliä, kunnes tyydyttävä ratkaisu on saavutettu.

Johdanto

Tässä oppitunnissa käsitellään:

Oppimistavoitteet

Oppitunnin jälkeen osaat/ymmärrät:

Mikä on Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) on nouseva tekoälyn paradigma, jossa suuret kielimallit (LLM:t) suunnittelevat itsenäisesti seuraavat askeleensa samalla kun hakevat tietoa ulkoisista lähteistä. Toisin kuin staattiset haku-ja-lukeminen -mallit, Agentic RAG sisältää iteratiivisia kutsuja LLM:lle, joita vuorottelevat työkalujen tai funktioiden kutsut ja rakenteelliset tulokset. Järjestelmä arvioi tuloksia, tarkentaa kyselyitä, käyttää tarvittaessa lisätyökaluja ja jatkaa tätä sykliä, kunnes tyydyttävä ratkaisu on saavutettu. Tämä iteratiivinen “maker-checker”-tyyli parantaa tarkkuutta, käsittelee virheellisiä kyselyitä ja varmistaa korkealaatuiset tulokset.

Järjestelmä hallitsee aktiivisesti omaa päättelyprosessiaan, kirjoittaa uudelleen epäonnistuneita kyselyitä, valitsee erilaisia hakumenetelmiä ja integroi useita työkaluja—kuten vektorihaku Azure AI Searchissa, SQL-tietokantoja tai mukautettuja API:ita—ennen lopullisen vastauksen antamista. Agenttijärjestelmän erottava ominaisuus on sen kyky hallita omaa päättelyprosessiaan. Perinteiset RAG-toteutukset luottavat ennalta määriteltyihin polkuihin, mutta agenttijärjestelmä päättää itsenäisesti askelten järjestyksen sen perusteella, mitä tietoa se löytää.

Agentic Retrieval-Augmented Generation (Agentic RAG) määritelmä

Agentic Retrieval-Augmented Generation (Agentic RAG) on nouseva paradigma tekoälyn kehityksessä, jossa LLM:t eivät ainoastaan hae tietoa ulkoisista tietolähteistä, vaan myös suunnittelevat itsenäisesti seuraavat askeleensa. Toisin kuin staattiset haku-ja-lukeminen -mallit tai huolellisesti skriptatut kehotussekvenssit, Agentic RAG sisältää iteratiivisia kutsuja LLM:lle, joita vuorottelevat työkalujen tai funktioiden kutsut ja rakenteelliset tulokset. Joka käänteessä järjestelmä arvioi saatuja tuloksia, päättää, tarkentaako kyselyitä, käyttääkö lisätyökaluja tarvittaessa ja jatkaa tätä sykliä, kunnes tyydyttävä ratkaisu on saavutettu.

Tämä iteratiivinen “maker-checker”-tyyli on suunniteltu parantamaan tarkkuutta, käsittelemään virheellisiä kyselyitä rakenteellisiin tietokantoihin (esim. NL2SQL) ja varmistamaan tasapainoiset, korkealaatuiset tulokset. Sen sijaan, että järjestelmä luottaisi pelkästään huolellisesti suunniteltuihin kehotusketjuihin, se hallitsee aktiivisesti omaa päättelyprosessiaan. Se voi kirjoittaa uudelleen epäonnistuneita kyselyitä, valita erilaisia hakumenetelmiä ja integroida useita työkaluja—kuten vektorihaku Azure AI Searchissa, SQL-tietokantoja tai mukautettuja API:ita—ennen lopullisen vastauksen antamista. Tämä poistaa tarpeen monimutkaisille orkestrointikehyksille. Sen sijaan suhteellisen yksinkertainen silmukka “LLM-kutsu → työkalun käyttö → LLM-kutsu → …” voi tuottaa hienostuneita ja hyvin perusteltuja tuloksia.

Agentic RAG Core Loop

Päättelyprosessin hallinta

Agenttijärjestelmän erottava ominaisuus on sen kyky hallita omaa päättelyprosessiaan. Perinteiset RAG-toteutukset usein riippuvat ihmisistä, jotka määrittelevät mallille polun: ajatusketjun, joka hahmottaa, mitä hakea ja milloin. Mutta kun järjestelmä on aidosti agenttimainen, se päättää sisäisesti, miten lähestyä ongelmaa. Se ei vain suorita skriptiä; se määrittää itsenäisesti askelten järjestyksen sen perusteella, mitä tietoa se löytää.

Esimerkiksi, jos järjestelmää pyydetään luomaan tuotelanseerausstrategia, se ei luota pelkästään kehotukseen, joka määrittelee koko tutkimus- ja päätöksentekotyönkulun. Sen sijaan agenttimalli päättää itsenäisesti:

  1. Hakea nykyiset markkinatrendiraportit Bing Web Groundingin avulla.
  2. Tunnistaa relevantit kilpailijatiedot Azure AI Searchin avulla.
  3. Korreloida historialliset sisäiset myyntimittarit Azure SQL Databasea käyttäen.
  4. Yhdistää löydökset yhtenäiseksi strategiaksi, jota orkestroidaan Azure OpenAI Servicen avulla.
  5. Arvioida strategiaa aukkojen tai epäjohdonmukaisuuksien varalta, mikä voi johtaa uuteen hakukierrokseen.

Kaikki nämä askeleet—kyselyiden tarkentaminen, lähteiden valinta, iterointi kunnes vastaus on “tyydyttävä”—päätetään mallin toimesta, ei ihmisen ennalta skriptamana.

Iteratiiviset silmukat, työkalujen integrointi ja muisti

Tool Integration Architecture

Agenttijärjestelmä perustuu silmukkamaiseen vuorovaikutusmalliin:

Ajan myötä tämä luo tunteen kehittyvästä ymmärryksestä, mahdollistaen mallin navigoida monimutkaisia, monivaiheisia tehtäviä ilman, että ihmisen täytyy jatkuvasti puuttua asiaan tai muotoilla kehotusta uudelleen.

Virhetilanteiden käsittely ja itsekorjaus

Agentic RAG:n autonomia sisältää myös vahvat itsekorjausmekanismit. Kun järjestelmä kohtaa umpikujia—kuten hakee epäolennaisia dokumentteja tai kohtaa virheellisiä kyselyitä—se voi:

Tämä iteratiivinen ja dynaaminen lähestymistapa mahdollistaa mallin jatkuvan parantamisen, varmistaen, että se ei ole vain kertaluonteinen järjestelmä, vaan oppii virheistään kyseisen istunnon aikana.

Self Correction Mechanism

Toiminnan rajat

Vaikka Agentic RAG on autonominen tehtävän sisällä, se ei ole verrattavissa yleiseen tekoälyyn (Artificial General Intelligence). Sen “agenttimaiset” kyvyt rajoittuvat ihmisten kehittäjien tarjoamiin työkaluihin, tietolähteisiin ja käytäntöihin. Se ei voi keksiä omia työkalujaan tai astua ulos sille asetetuista toimialarajoista. Sen sijaan se loistaa dynaamisesti orkestroimalla käytettävissä olevia resursseja.

Keskeiset erot kehittyneempiin tekoälymuotoihin verrattuna:

  1. Toimialakohtainen autonomia: Agentic RAG -järjestelmät keskittyvät käyttäjän määrittelemiin tavoitteisiin tunnetussa toimialassa, käyttäen strategioita kuten kyselyiden uudelleenkirjoittamista tai työkalujen valintaa parantaakseen tuloksia.
  2. Infrastruktuuririippuvuus: Järjestelmän kyvyt riippuvat kehittäjien integroimista työkaluista ja datasta. Se ei voi ylittää näitä rajoja ilman ihmisen väliintuloa.
  3. Turvamekanismien kunnioittaminen: Eettiset ohjeet, vaatimustenmukaisuussäännöt ja liiketoimintakäytännöt ovat edelleen erittäin tärkeitä. Agentin vapaus on aina rajoitettu turvallisuusmekanismeilla ja valvontajärjestelmillä (toivottavasti?).

Käytännön käyttötapaukset ja arvo

Agentic RAG loistaa tilanteissa, jotka vaativat iteratiivista tarkentamista ja tarkkuutta:

  1. Tarkkuuslähtöiset ympäristöt: Vaatimustenmukaisuustarkastuksissa, sääntelyanalyysissä tai oikeudellisessa tutkimuksessa agenttimalli voi toistuvasti varmistaa faktat, konsultoida useita lähteitä ja kirjoittaa kyselyitä uudelleen, kunnes se tuottaa perusteellisesti tarkistetun vastauksen.
  2. Monimutkaiset tietokantainteraktiot: Kun käsitellään rakenteellista dataa, jossa kyselyt usein epäonnistuvat tai vaativat säätöä, järjestelmä voi itsenäisesti tarkentaa kyselyitään käyttäen Azure SQL:ää tai Microsoft Fabric OneLakea, varmistaen lopullisen haun vastaavan käyttäjän tarkoitusta.
  3. Laajennetut työnkulut: Pidemmät istunnot voivat kehittyä, kun uutta tietoa tulee esiin. Agentic RAG voi jatkuvasti sisällyttää uutta dataa, muuttaa strategioita oppiessaan lisää ongelma-alueesta.

Hallinta, läpinäkyvyys ja luottamus

Kun nämä järjestelmät tulevat yhä autonomisemmiksi päättelyssään, hallinta ja läpinäkyvyys ovat ratkaisevan tärkeitä:

Työkalut, jotka tarjoavat selkeän kirjanpidon toimista, ovat välttämättömiä. Ilman niitä monivaiheisen prosessin virheenkorjaus voi olla erittäin vaikeaa. Katso seuraava esimerkki Literal AI:lta (Chainlitin takana oleva yritys) agentin suorituksesta:

![AgentRunExample](./images/AgentRunExample.png

Tieteelliset artikkelit

Edellinen oppitunti

Työkalujen käyttö -suunnittelumalli

Seuraava oppitunti

Luotettavien AI-agenttien rakentaminen


Vastuuvapauslauseke:
Tämä asiakirja on käännetty käyttämällä tekoälypohjaista käännöspalvelua Co-op Translator. Vaikka pyrimme tarkkuuteen, huomioithan, että automaattiset käännökset voivat sisältää virheitä tai epätarkkuuksia. Alkuperäistä asiakirjaa sen alkuperäisellä kielellä tulisi pitää ensisijaisena lähteenä. Kriittisen tiedon osalta suositellaan ammattimaista ihmiskäännöstä. Emme ole vastuussa väärinkäsityksistä tai virhetulkinnoista, jotka johtuvat tämän käännöksen käytöstä.