ai-agents-for-beginners

Agentic RAG

(I-click ang larawan sa itaas upang mapanood ang video ng araling ito)

Agentic RAG

Ang araling ito ay nagbibigay ng komprehensibong paliwanag tungkol sa Agentic Retrieval-Augmented Generation (Agentic RAG), isang umuusbong na paradigma sa AI kung saan ang mga large language models (LLMs) ay kusang nagpaplano ng kanilang mga susunod na hakbang habang kumukuha ng impormasyon mula sa mga panlabas na mapagkukunan. Hindi tulad ng mga static na retrieval-then-read na mga pattern, ang Agentic RAG ay gumagamit ng paulit-ulit na tawag sa LLM, na sinisingitan ng mga tawag sa tool o function at mga nakabalangkas na output. Sinusuri ng sistema ang mga resulta, pinapabuti ang mga query, gumagamit ng karagdagang mga tool kung kinakailangan, at nagpapatuloy sa siklong ito hanggang sa makamit ang isang kasiya-siyang solusyon.

Panimula

Tatalakayin sa araling ito ang:

Mga Layunin sa Pagkatuto

Pagkatapos makumpleto ang araling ito, malalaman mo kung paano/unawain ang:

Ano ang Agentic RAG?

Ang Agentic Retrieval-Augmented Generation (Agentic RAG) ay isang umuusbong na paradigma sa AI kung saan ang mga LLM ay kusang nagpaplano ng kanilang mga susunod na hakbang habang kumukuha ng impormasyon mula sa mga panlabas na mapagkukunan. Hindi tulad ng mga static na retrieval-then-read na mga pattern, ang Agentic RAG ay gumagamit ng paulit-ulit na tawag sa LLM, na sinisingitan ng mga tawag sa tool o function at mga nakabalangkas na output. Sinusuri ng sistema ang mga resulta, pinapabuti ang mga query, gumagamit ng karagdagang mga tool kung kinakailangan, at nagpapatuloy sa siklong ito hanggang sa makamit ang isang kasiya-siyang solusyon. Ang iterative na “maker-checker” na istilo na ito ay nagpapabuti sa katumpakan, humahawak sa mga maling query, at tinitiyak ang mataas na kalidad na mga resulta.

Aktibong inaako ng sistema ang proseso ng pangangatwiran nito, muling isinusulat ang mga nabigong query, pumipili ng iba’t ibang paraan ng retrieval, at nagsasama ng maraming tool—tulad ng vector search sa Azure AI Search, SQL databases, o custom APIs—bago tapusin ang sagot nito. Ang natatanging katangian ng isang agentic na sistema ay ang kakayahan nitong akuin ang proseso ng pangangatwiran nito. Ang mga tradisyunal na implementasyon ng RAG ay umaasa sa mga paunang natukoy na landas, ngunit ang isang agentic na sistema ay kusang nagpapasya sa pagkakasunod-sunod ng mga hakbang batay sa kalidad ng impormasyong natuklasan nito.

Pagpapaliwanag sa Agentic Retrieval-Augmented Generation (Agentic RAG)

Ang Agentic Retrieval-Augmented Generation (Agentic RAG) ay isang umuusbong na paradigma sa pag-develop ng AI kung saan ang mga LLM ay hindi lamang kumukuha ng impormasyon mula sa mga panlabas na mapagkukunan ng data kundi kusang nagpaplano rin ng kanilang mga susunod na hakbang. Hindi tulad ng mga static na retrieval-then-read na mga pattern o maingat na scripted na mga prompt sequence, ang Agentic RAG ay gumagamit ng loop ng paulit-ulit na tawag sa LLM, na sinisingitan ng mga tawag sa tool o function at mga nakabalangkas na output. Sa bawat hakbang, sinusuri ng sistema ang mga resulta na nakuha nito, nagpapasya kung kailangang pinuhin ang mga query, gumagamit ng karagdagang mga tool kung kinakailangan, at nagpapatuloy sa siklong ito hanggang sa makamit ang isang kasiya-siyang solusyon.

Ang iterative na “maker-checker” na istilo ng operasyon na ito ay idinisenyo upang mapabuti ang katumpakan, maayos ang mga maling query sa mga nakabalangkas na database (hal. NL2SQL), at matiyak ang balanseng, mataas na kalidad na mga resulta. Sa halip na umasa lamang sa maingat na ininhinyerong mga prompt chain, aktibong inaako ng sistema ang proseso ng pangangatwiran nito. Maaari nitong muling isulat ang mga nabigong query, pumili ng iba’t ibang paraan ng retrieval, at magsama ng maraming tool—tulad ng vector search sa Azure AI Search, SQL databases, o custom APIs—bago tapusin ang sagot nito. Tinanggal nito ang pangangailangan para sa sobrang kumplikadong mga orchestration framework. Sa halip, ang isang medyo simpleng loop ng “LLM call → tool use → LLM call → …” ay maaaring magbunga ng sopistikado at maayos na mga output.

Agentic RAG Core Loop

Pagmamay-ari ng Proseso ng Pangangatwiran

Ang natatanging katangian na gumagawa sa isang sistema na “agentic” ay ang kakayahan nitong akuin ang proseso ng pangangatwiran nito. Ang mga tradisyunal na implementasyon ng RAG ay madalas na umaasa sa mga tao upang paunang tukuyin ang isang landas para sa modelo: isang chain-of-thought na nagbabalangkas kung ano ang kukunin at kailan. Ngunit kapag ang isang sistema ay tunay na agentic, ito mismo ang nagpapasya kung paano haharapin ang problema. Hindi lamang ito sumusunod sa isang script; kusang tinutukoy nito ang pagkakasunod-sunod ng mga hakbang batay sa kalidad ng impormasyong natuklasan nito.

Halimbawa, kung hihilingin itong lumikha ng isang estratehiya para sa paglulunsad ng produkto, hindi ito umaasa lamang sa isang prompt na nagdedetalye ng buong proseso ng pananaliksik at paggawa ng desisyon. Sa halip, ang agentic na modelo ay kusang nagpapasya na:

  1. Kumuha ng mga ulat sa kasalukuyang trend ng merkado gamit ang Bing Web Grounding.
  2. Tukuyin ang may kaugnayang data ng mga kakumpitensya gamit ang Azure AI Search.
  3. Iugnay ang mga makasaysayang panloob na sukatan ng benta gamit ang Azure SQL Database.
  4. Buoin ang mga natuklasan sa isang magkakaugnay na estratehiya na inayos gamit ang Azure OpenAI Service.
  5. Suriin ang estratehiya para sa mga puwang o hindi pagkakapare-pareho, na nag-uudyok ng isa pang round ng retrieval kung kinakailangan.

Lahat ng mga hakbang na ito—pagpapabuti ng mga query, pagpili ng mga mapagkukunan, pag-ulit hanggang sa “masiyahan” sa sagot—ay desisyon ng modelo, hindi paunang iniskrip ng tao.

Iterative Loops, Tool Integration, at Memory

Tool Integration Architecture

Ang isang agentic na sistema ay umaasa sa isang pattern ng looped interaction:

Sa paglipas ng panahon, lumilikha ito ng pakiramdam ng umuunlad na pag-unawa, na nagbibigay-daan sa modelo na mag-navigate sa mga kumplikado at maraming hakbang na gawain nang hindi kinakailangang patuloy na manghimasok o baguhin ng tao ang prompt.

Pagharap sa Mga Mode ng Pagkabigo at Pagwawasto sa Sarili

Ang awtonomiya ng Agentic RAG ay kinabibilangan din ng matibay na mekanismo para sa pagwawasto sa sarili. Kapag ang sistema ay nakaranas ng mga dead end—tulad ng pagkuha ng mga hindi kaugnay na dokumento o pagharap sa mga maling query—maaari itong:

Ang iterative at dynamic na diskarte na ito ay nagbibigay-daan sa modelo na patuloy na mapabuti, na tinitiyak na hindi lamang ito isang one-shot na sistema kundi isang sistemang natututo mula sa mga pagkakamali nito sa isang partikular na sesyon.

Self Correction Mechanism

Mga Hangganan ng Ahensya

Sa kabila ng awtonomiya nito sa loob ng isang gawain, ang Agentic RAG ay hindi katumbas ng Artificial General Intelligence. Ang mga “agentic” na kakayahan nito ay limitado sa mga tool, mapagkukunan ng data, at mga patakaran na ibinigay ng mga developer ng tao. Hindi ito maaaring lumikha ng sarili nitong mga tool o lumampas sa mga hangganan ng domain na itinakda. Sa halip, namumukod-tangi ito sa dynamic na pag-oorganisa ng mga mapagkukunan na nasa kamay.

Ang mga pangunahing pagkakaiba mula sa mas advanced na mga anyo ng AI ay kinabibilangan ng:

  1. Domain-Specific Autonomy: Ang mga sistema ng Agentic RAG ay nakatuon sa pagkamit ng mga layunin na itinakda ng user sa loob ng isang kilalang domain, gumagamit ng mga estratehiya tulad ng query rewriting o pagpili ng tool upang mapabuti ang mga resulta.
  2. Pag-asa sa Imprastraktura: Ang mga kakayahan ng sistema ay nakasalalay sa mga tool at data na isinama ng mga developer. Hindi nito malalampasan ang mga hangganang ito nang walang interbensyon ng tao.
  3. Paggalang sa Mga Guardrail: Ang mga alituntunin sa etika, mga panuntunan sa pagsunod, at mga patakaran sa negosyo ay nananatiling napakahalaga. Ang kalayaan ng agent ay palaging limitado ng mga hakbang sa kaligtasan at mga mekanismo ng pangangasiwa (sana?).

Praktikal na Mga Gamit at Halaga

Namumukod-tangi ang Agentic RAG sa mga sitwasyong nangangailangan ng paulit-ulit na pagpapabuti at katumpakan:

  1. Mga Kapaligirang Inuuna ang Katumpakan: Sa mga pagsusuri sa pagsunod, pagsusuri sa regulasyon, o pananaliksik sa legal, maaaring paulit-ulit na i-verify ng agentic na modelo ang mga katotohanan, kumonsulta sa maraming mapagkukunan, at muling isulat ang mga query hanggang sa makabuo ito ng isang masusing sinuring sagot.
  2. Kumplikadong Interaksyon sa Database: Kapag humaharap sa mga nakabalangkas na data kung saan madalas mabigo o kailangang ayusin ang mga query, maaaring kusang pinuhin ng sistema ang mga query nito gamit ang Azure SQL o Microsoft Fabric OneLake, na tinitiyak na ang huling retrieval ay naaayon sa layunin ng user.
  3. Pinalawig na Workflow: Ang mga mas mahabang sesyon ay maaaring umunlad habang lumilitaw ang bagong impormasyon. Ang Agentic RAG ay maaaring patuloy na isama ang bagong data, binabago ang mga estratehiya habang natututo ito nang higit pa tungkol sa espasyo ng problema.

Pamamahala, Transparency, at Tiwala

Habang ang mga sistemang ito ay nagiging mas awtonomo sa kanilang pangangatwiran, mahalaga ang pamamahala at transparency:

Ang pagkakaroon ng mga tool na nagbibigay ng malinaw na talaan ng mga Implementasyon ng Retrieval Augmented Generation (RAG) gamit ang Azure OpenAI Service: Alamin kung paano gamitin ang sarili mong data sa Azure OpenAI Service. Ang Microsoft Learn module na ito ay nagbibigay ng komprehensibong gabay sa pag-implement ng RAG

Mga Akademikong Papel

Nakaraang Aralin

Tool Use Design Pattern

Susunod na Aralin

Pagbuo ng Mapagkakatiwalaang AI Agents


Paunawa:
Ang dokumentong ito ay isinalin gamit ang AI translation service na Co-op Translator. Bagama’t sinisikap naming maging tumpak, pakitandaan na ang mga awtomatikong pagsasalin ay maaaring maglaman ng mga pagkakamali o hindi pagkakatugma. Ang orihinal na dokumento sa orihinal nitong wika ang dapat ituring na opisyal na sanggunian. Para sa mahalagang impormasyon, inirerekomenda ang propesyonal na pagsasalin ng tao. Hindi kami mananagot sa anumang hindi pagkakaunawaan o maling interpretasyon na maaaring magmula sa paggamit ng pagsasaling ito.