
(Klikkaa yllä olevaa kuvaa katsoaksesi tämän oppitunnin videon)
Agentic RAG
Tämä oppitunti tarjoaa kattavan yleiskatsauksen Agentic Retrieval-Augmented Generationiin (Agentic RAG), nousevaan tekoälyparadigmaan, jossa suuret kielimallit (LLM:t) suunnittelevat itsenäisesti seuraavat askeleensa samalla, kun ne hakevat tietoa ulkoisista lähteistä. Toisin kuin staattiset “haku ja luku” -mallit, Agentic RAG sisältää iteratiivisia kutsuja LLM:lle, joita vuorottelevat työkalujen tai toimintojen kutsut ja jäsennellyt tulosteet. Järjestelmä arvioi tuloksia, tarkentaa kyselyitä, käyttää tarvittaessa lisätyökaluja ja jatkaa tätä sykliä, kunnes saavutetaan tyydyttävä ratkaisu.
Johdanto
Tässä oppitunnissa käsitellään:
- Ymmärrä Agentic RAG: Opi tekoälyn nousevasta paradigmasta, jossa suuret kielimallit (LLM:t) suunnittelevat itsenäisesti seuraavat askeleensa samalla, kun ne hakevat tietoa ulkoisista tietolähteistä.
- Omaksu iteratiivinen Maker-Checker-tyyli: Ymmärrä iteratiivisten LLM-kutsujen sykli, jota vuorottelevat työkalujen tai toimintojen kutsut ja jäsennellyt tulosteet, jotka on suunniteltu parantamaan tarkkuutta ja käsittelemään virheellisiä kyselyitä.
- Tutki käytännön sovelluksia: Tunnista tilanteet, joissa Agentic RAG loistaa, kuten tarkkuutta vaativat ympäristöt, monimutkaiset tietokantainteraktiot ja laajennetut työnkulut.
Oppimistavoitteet
Oppitunnin jälkeen osaat/ymmärrät:
- Agentic RAG:n ymmärtäminen: Opi tekoälyn nousevasta paradigmasta, jossa suuret kielimallit (LLM:t) suunnittelevat itsenäisesti seuraavat askeleensa samalla, kun ne hakevat tietoa ulkoisista tietolähteistä.
- Iteratiivinen Maker-Checker-tyyli: Ymmärrä iteratiivisten LLM-kutsujen sykli, jota vuorottelevat työkalujen tai toimintojen kutsut ja jäsennellyt tulosteet, jotka on suunniteltu parantamaan tarkkuutta ja käsittelemään virheellisiä kyselyitä.
- Päätöksenteon hallinta: Ymmärrä järjestelmän kyky hallita omaa päättelyprosessiaan ja tehdä päätöksiä ongelmien lähestymistavasta ilman ennalta määriteltyjä polkuja.
- Työnkulku: Ymmärrä, miten agenttimalli päättää itsenäisesti hakea markkinatrendiraportteja, tunnistaa kilpailijatietoja, yhdistää sisäisiä myyntimittareita, synteettisesti analysoida löydöksiä ja arvioida strategiaa.
- Iteratiiviset silmukat, työkalujen integrointi ja muisti: Opi, miten järjestelmä hyödyntää silmukkamaista vuorovaikutusmallia, ylläpitää tilaa ja muistia vaiheiden välillä välttääkseen toistuvia silmukoita ja tehdäkseen tietoisia päätöksiä.
- Virhetilanteiden käsittely ja itsekorjaus: Tutki järjestelmän vahvoja itsekorjausmekanismeja, mukaan lukien iterointi ja uudelleenkysely, diagnostiikkatyökalujen käyttö ja ihmisen valvontaan turvautuminen.
- Toimintavapauden rajat: Ymmärrä Agentic RAG:n rajoitukset, keskittyen toimialakohtaiseen autonomiaan, infrastruktuuririippuvuuteen ja turvamekanismien kunnioittamiseen.
- Käytännön käyttötapaukset ja arvo: Tunnista tilanteet, joissa Agentic RAG loistaa, kuten tarkkuutta vaativat ympäristöt, monimutkaiset tietokantainteraktiot ja laajennetut työnkulut.
- Hallinta, läpinäkyvyys ja luottamus: Opi hallinnan ja läpinäkyvyyden tärkeydestä, mukaan lukien selitettävä päättely, puolueettomuuden hallinta ja ihmisen valvonta.
Mikä on Agentic RAG?
Agentic Retrieval-Augmented Generation (Agentic RAG) on nouseva tekoälyparadigma, jossa suuret kielimallit (LLM:t) suunnittelevat itsenäisesti seuraavat askeleensa samalla, kun ne hakevat tietoa ulkoisista lähteistä. Toisin kuin staattiset “haku ja luku” -mallit, Agentic RAG sisältää iteratiivisia kutsuja LLM:lle, joita vuorottelevat työkalujen tai toimintojen kutsut ja jäsennellyt tulosteet. Järjestelmä arvioi tuloksia, tarkentaa kyselyitä, käyttää tarvittaessa lisätyökaluja ja jatkaa tätä sykliä, kunnes saavutetaan tyydyttävä ratkaisu. Tämä iteratiivinen “maker-checker”-tyyli parantaa tarkkuutta, käsittelee virheellisiä kyselyitä ja varmistaa korkealaatuiset tulokset.
Järjestelmä hallitsee aktiivisesti omaa päättelyprosessiaan, kirjoittaa epäonnistuneet kyselyt uudelleen, valitsee erilaisia hakutapoja ja integroi useita työkaluja—kuten vektorihaun Azure AI Searchissa, SQL-tietokantoja tai mukautettuja API-rajapintoja—ennen lopullisen vastauksen antamista. Agenttijärjestelmän erottuva piirre on sen kyky hallita omaa päättelyprosessiaan. Perinteiset RAG-toteutukset luottavat ennalta määriteltyihin polkuihin, mutta agenttijärjestelmä päättää itsenäisesti askelten järjestyksen löytämänsä tiedon laadun perusteella.
Agentic Retrieval-Augmented Generationin (Agentic RAG) määrittely
Agentic Retrieval-Augmented Generation (Agentic RAG) on nouseva tekoälykehityksen paradigma, jossa LLM:t eivät ainoastaan hae tietoa ulkoisista tietolähteistä, vaan myös suunnittelevat itsenäisesti seuraavat askeleensa. Toisin kuin staattiset “haku ja luku” -mallit tai huolellisesti skriptatut kehotussekvenssit, Agentic RAG sisältää iteratiivisten LLM-kutsujen silmukan, jota vuorottelevat työkalujen tai toimintojen kutsut ja jäsennellyt tulosteet. Jokaisessa vaiheessa järjestelmä arvioi saatuja tuloksia, päättää, tarkentaako kyselyitä, käyttääkö lisätyökaluja ja jatkaa tätä sykliä, kunnes saavutetaan tyydyttävä ratkaisu.
Tämä iteratiivinen “maker-checker”-tyyli on suunniteltu parantamaan tarkkuutta, käsittelemään virheellisiä kyselyitä jäsenneltyihin tietokantoihin (esim. NL2SQL) ja varmistamaan tasapainoiset, korkealaatuiset tulokset. Sen sijaan, että järjestelmä luottaisi pelkästään huolellisesti suunniteltuihin kehotusketjuihin, se hallitsee aktiivisesti omaa päättelyprosessiaan. Se voi kirjoittaa epäonnistuneet kyselyt uudelleen, valita erilaisia hakutapoja ja integroida useita työkaluja—kuten vektorihaun Azure AI Searchissa, SQL-tietokantoja tai mukautettuja API-rajapintoja—ennen lopullisen vastauksen antamista. Tämä poistaa tarpeen monimutkaisille orkestrointikehyksille. Sen sijaan suhteellisen yksinkertainen silmukka “LLM-kutsu → työkalun käyttö → LLM-kutsu → …” voi tuottaa hienostuneita ja hyvin perusteltuja tuloksia.

Päättelyprosessin hallinta
Agenttijärjestelmän erottuva piirre on sen kyky hallita omaa päättelyprosessiaan. Perinteiset RAG-toteutukset luottavat usein ihmisten ennalta määrittelemään polkuun: ajatusketjuun, joka määrittelee, mitä hakea ja milloin.
Mutta kun järjestelmä on aidosti agenttinen, se päättää sisäisesti, miten ongelmaa lähestytään. Se ei vain suorita skriptiä; se määrittää itsenäisesti askelten järjestyksen löytämänsä tiedon laadun perusteella.
Esimerkiksi, jos sitä pyydetään luomaan tuotelanseerausstrategia, se ei luota pelkästään kehotukseen, joka määrittelee koko tutkimus- ja päätöksentekotyönkulun. Sen sijaan agenttimalli päättää itsenäisesti:
- Hakea ajankohtaisia markkinatrendiraportteja Bing Web Groundingin avulla.
- Tunnistaa olennaisia kilpailijatietoja Azure AI Searchin avulla.
- Yhdistää historiallisia sisäisiä myyntimittareita Azure SQL Databasea käyttäen.
- Synteettisesti analysoida löydökset yhtenäiseksi strategiaksi Azure OpenAI Servicen avulla.
- Arvioida strategiaa aukkojen tai epäjohdonmukaisuuksien varalta, mikä voi johtaa uuteen hakukierrokseen.
Kaikki nämä vaiheet—kyselyiden tarkentaminen, lähteiden valinta, iterointi, kunnes vastaus on “tyydyttävä”—päätetään mallin toimesta, ei ihmisen ennalta skriptamana.
Iteratiiviset silmukat, työkalujen integrointi ja muisti

Agenttijärjestelmä perustuu silmukkamaiseen vuorovaikutusmalliin:
- Alustava kutsu: Käyttäjän tavoite (eli käyttäjän kehotus) esitetään LLM:lle.
- Työkalun käyttö: Jos malli havaitsee puuttuvaa tietoa tai epäselviä ohjeita, se valitsee työkalun tai hakutavan—kuten vektorikantahakukyselyn (esim. Azure AI Search Hybrid -haku yksityisistä tiedoista) tai jäsennellyn SQL-kyselyn—hankkiakseen lisää kontekstia.
- Arviointi ja tarkentaminen: Palautetun datan tarkastelun jälkeen malli päättää, riittääkö tieto. Jos ei, se tarkentaa kyselyä, kokeilee eri työkalua tai säätää lähestymistapaansa.
- Toista, kunnes tyytyväinen: Tämä sykli jatkuu, kunnes malli katsoo, että sillä on tarpeeksi selkeyttä ja todisteita lopullisen, hyvin perustellun vastauksen antamiseen.
- Muisti ja tila: Koska järjestelmä ylläpitää tilaa ja muistia vaiheiden välillä, se voi muistaa aiemmat yritykset ja niiden tulokset, välttäen toistuvia silmukoita ja tehden tietoisempia päätöksiä edetessään.
Ajan myötä tämä luo tunteen kehittyvästä ymmärryksestä, mikä mahdollistaa mallin navigoida monimutkaisissa, monivaiheisissa tehtävissä ilman, että ihmisen tarvitsee jatkuvasti puuttua asiaan tai muokata kehotusta.
Virhetilanteiden käsittely ja itsekorjaus
Agentic RAG:n autonomia sisältää myös vahvat itsekorjausmekanismit. Kun järjestelmä kohtaa umpikujaan johtavia tilanteita—kuten epäolennaisten dokumenttien hakemista tai virheellisiä kyselyitä—se voi:
- Iteroida ja kysyä uudelleen: Sen sijaan, että se palauttaisi vähäarvoisia vastauksia, malli kokeilee uusia hakustrategioita, kirjoittaa tietokantakyselyitä uudelleen tai tarkastelee vaihtoehtoisia tietojoukkoja.
- Käyttää diagnostiikkatyökaluja: Järjestelmä voi kutsua lisätoimintoja, jotka on suunniteltu auttamaan sen päättelyvaiheiden virheenkorjauksessa tai varmistamaan haetun datan oikeellisuus. Työkalut, kuten Azure AI Tracing, ovat tärkeitä mahdollistamaan vahvan havainnoinnin ja seurannan.
- Turvautua ihmisen valvontaan: Korkean riskin tai toistuvasti epäonnistuvissa tilanteissa malli voi merkitä epävarmuuden ja pyytää ihmisen ohjausta. Kun ihminen antaa korjaavaa palautetta, malli voi sisällyttää oppimansa jatkossa.
Tämä iteratiivinen ja dynaaminen lähestymistapa mahdollistaa mallin jatkuvan parantamisen, varmistaen, että se ei ole vain kertakäyttöinen järjestelmä, vaan oppii virheistään kyseisen istunnon aikana.

Toimintavapauden rajat
Vaikka Agentic RAG on autonominen tehtävänsä sisällä, se ei ole verrattavissa yleiseen tekoälyyn (Artificial General Intelligence). Sen “agenttiset” kyvyt rajoittuvat ihmisten kehittämiin työkaluihin, tietolähteisiin ja käytäntöihin. Se ei voi keksiä omia työkalujaan tai ylittää sille asetettuja toimialarajoja. Sen sijaan se loistaa dynaamisesti orkestroimalla käytettävissä olevia resursseja.
Keskeiset erot kehittyneempiin tekoälymuotoihin ovat:
- Toimialakohtainen autonomia: Agentic RAG -järjestelmät keskittyvät käyttäjän määrittämien tavoitteiden saavuttamiseen tunnetulla toimialalla, hyödyntäen strategioita, kuten kyselyiden uudelleenkirjoittamista tai työkalujen valintaa tulosten parantamiseksi.
- Infrastruktuuririippuvuus: Järjestelmän kyvyt riippuvat kehittäjien integroimista työkaluista ja tiedoista. Se ei voi ylittää näitä rajoja ilman ihmisen väliintuloa.
- Turvamekanismien kunnioittaminen: Eettiset ohjeet, sääntöjen noudattaminen ja liiketoimintakäytännöt ovat edelleen erittäin tärkeitä. Agentin vapaus on aina rajoitettu turvallisuusmekanismeilla ja valvontajärjestelmillä (toivottavasti?).
Käytännön käyttötapaukset ja arvo
Agentic RAG loistaa tilanteissa, jotka vaativat iteratiivista tarkentamista ja tarkkuutta:
- Tarkkuutta vaativat ympäristöt: Säädösten tarkastuksissa, sääntelyanalyysissä tai oikeudellisessa tutkimuksessa agenttimalli voi toistuvasti tarkistaa faktoja, konsultoida useita lähteitä ja kirjoittaa kyselyitä uudelleen, kunnes se tuottaa perusteellisesti tarkistetun vastauksen.
- Monimutkaiset tietokantainteraktiot: Kun käsitellään jäsenneltyjä tietoja, joissa kyselyt voivat usein epäonnistua tai vaatia säätöä, järjestelmä voi itsenäisesti tarkentaa kyselyitään Azure SQL:n tai Microsoft Fabric OneLaken avulla varmistaen, että lopullinen haku vastaa käyttäjän tarkoitusta.
- Laajennetut työnkulut: Pidemmät istunnot voivat kehittyä, kun uutta tietoa tulee esiin. Agentic RAG voi jatkuvasti sisällyttää uutta dataa, muuttaa strategioita ja oppia lisää ongelma-alueesta.
Hallinta, läpinäkyvyys ja luottamus
Kun nämä järjestelmät tulevat yhä itsenäisemmiksi päättelyssään, hallinta ja läpinäkyvyys ovat ratkaisevan tärkeitä:
- Selitettävä päättely: Malli voi tarjota auditointipolun tekemistään kyselyistä, konsultoimistaan lähteistä ja päättelyvaiheista, jotka johtivat sen lopputulokseen. Työkalut, kuten Azure AI Content Safety ja Azure AI Tracing / GenAIOps, voivat auttaa ylläpitämään läpinäkyvyyttä ja vähentämään riskejä.
- Puolueettomuuden hallinta ja tasapainoinen haku: Kehittäjät voivat säätää hakustrategioita varmistaakseen, että tasapainoiset ja edustavat tietolähteet otetaan huomioon, ja säännöllisesti auditoida tuloksia puolueellisuuden tai vinoutuneiden mallien havaitsemiseksi käyttämällä mukautettuja malleja edistyneille data science -organisaatioille Azure Machine Learningin avulla.
- Ihmisen valvonta ja sääntöjen noudattaminen: Herkissä tehtävissä ihmisen tarkistus on edelleen välttämätöntä. Agentic RAG ei korvaa ihmisen harkintaa korkean panoksen päätöksissä—se täydentää sitä tarjoamalla perusteellisemmin tarkistettuja vaihtoehtoja.
Työkalut, jotka tarjoavat selkeän toimintarekisterin, ovat välttämättömiä. Ilman niitä monivaiheisen prosessin virheenk
Toteuta Retrieval Augmented Generation (RAG) Azure OpenAI -palvelulla: Opi käyttämään omaa dataasi Azure OpenAI -palvelun kanssa. Tämä Microsoft Learn -moduuli tarjoaa kattavan oppaan RAG:n toteuttamiseen
Akateemiset artikkelit
Edellinen oppitunti
Työkalujen käyttö -suunnittelumalli
Seuraava oppitunti
Luotettavien tekoälyagenttien rakentaminen
Vastuuvapauslauseke:
Tämä asiakirja on käännetty käyttämällä tekoälypohjaista käännöspalvelua Co-op Translator. Vaikka pyrimme tarkkuuteen, huomioithan, että automaattiset käännökset voivat sisältää virheitä tai epätarkkuuksia. Alkuperäinen asiakirja sen alkuperäisellä kielellä tulisi pitää ensisijaisena lähteenä. Kriittisen tiedon osalta suositellaan ammattimaista ihmiskäännöstä. Emme ole vastuussa väärinkäsityksistä tai virhetulkinnoista, jotka johtuvat tämän käännöksen käytöstä.