ai-agents-for-beginners

Agentic RAG

(Кликните на горњу слику да бисте видели видео о овом часу)

Agentic RAG

Овај час пружа свеобухватан преглед Agentic Retrieval-Augmented Generation (Agentic RAG), новог парадигма вештачке интелигенције у коме велики језички модели (LLMs) аутономно планирају своје наредне кораке док прикупљају информације из спољашњих извора. За разлику од статичних модела са приступом „преузми-па-прочитај“, Agentic RAG укључује итеративне позиве LLM-у, испресецане позивима алата или функција и структуриране излазе. Систем процењује резултате, унапређује упите, по потреби позива додатне алате и наставља овај циклус све док не постигне задовољавајуће решење.

Увод

Овај час ће обухватити

Циљеви учења

Након завршетка овог часа, знаћете како да/разумете:

Шта је Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) је нови парадигма у вештачкој интелигенцији која омогућава великим језичким моделима (LLMs) да аутономно планирају своје наредне кораке док прикупљају информације из спољашњих извора. За разлику од статичних „преузми-па-прочитај“ модела, Agentic RAG укључује итеративне позиве LLM-у, испресецане коришћењем алата или функција и структурираним излазима. Систем процењује резултате, унапређује упите, по потреби позива додатне алате и наставља овај циклус све док не постигне задовољавајуће решење. Ова итеративна„maker-checker“ метода побољшава тачност, обрађује неисправне упите и обезбеђује резултате високе квалитете.

Систем активно поседује свој процес размишљања, преписује неуспеле упите, бира различите методе претраживања и интегрише више алата — као што су претраживање вектором у Azure AI Search, SQL базе података или прилагођени API-ји — пре него што финализује одговор. Карактеристика која издваја агентски систем је његова способност да контролише свој процес расуђивања. Традиционалне RAG имплементације зависе од унапред дефинисаних путања, али агентски систем аутономно одређује низ корака на основу квалитета пронађених информација.

Дефинисање Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) је нова AI парадигма где LLM-ови не само да преузимају информације из спољашњих извора података већ аутономно планирају своје следеће кораке. За разлику од статичних модела „преузми-па-прочитај“ или пажљиво скриптованих низа упита, Agentic RAG укључује петљу итеративних позива LLM-у, испресецану позивима алата или функција и структуираним излазима. На сваком кораку, систем процењује резултате, одлучује да ли треба унапредити упите, позива додатне алате по потреби, и наставља овај процес све док не постигне задовољавајуће решење.

Ова итеративна „maker-checker“ метода је дизајнирана да побољша тачност, обради неисправне упите ка структурираним базама података (нпр. NL2SQL) и обезбеди уравнотежене, квалитетне резултате. Уместо ослањања само на пажљиво осмишљене ланце упита, систем активно контролише свој процес размишљања. Може преписивати упите који не успевају, бирати различите методе претраживања и интегрисати више алата — као што су претраживање вектора у Azure AI Search, SQL базе података или прилагођени API-ји — пре него што финализује одговор. Ово уклања потребу за прекомпликованим системима оркестрације. Уместо тога, релативно једноставна петља „позив LLM → коришћење алата → позив LLM → …“ може произвести софистициране и добро утемељене резултате.

Agentic RAG Core Loop

Власништво над процесом размишљања

Карактеристика која систем чини „агентским“ јесте његова способност да контролише свој процес размишљања. Традиционалне RAG имплементације често зависе од тога да људи унапред дефинишу пут за модел: ланац размишљања који одређује шта и када треба преузети. Али када је систем заиста агентски, он унутрашње одлучује како да приступи проблему. Он не извршава само скрипту; аутономно одређује низ корака на основу квалитета информација које пронађе. На пример, ако му се затражи да креира стратегију лансирања производа, он се не ослања само на упит који описује цели процес истраживања и доношења одлука. Уместо тога, агентски модел независно одлучује да:

  1. Преузме тренутне извештаје о тржишним трендовима користећи Bing Web Grounding
  2. Идентификује релевантне податке о конкурентима користећи Azure AI Search.
  3. Корелира историјске унутрашње показатеље продаје користећи Azure SQL Database.
  4. Синтетише налазе у кохезивну стратегију коју оркестрира Azure OpenAI Service.
  5. Процењује стратегију тражећи празнине или неусклађености, подстичући још један круг преузимања ако је потребно. Све ове кораке — унапређивање упита, избор извора, итерација све док не буде „задовољан“ одговором — одлучује модел, а не човек који је направио скрипту.

Итеративне петље, интеграција алата и меморија

Tool Integration Architecture

Агентски систем се ослања на петљасти образац интеракције:

Временом, ово ствара осећај еволуирајућег разумевања, омогућавајући моделу да навигира кроз сложене, вишекорачне задатке без потребе за сталном људском интервенцијом или променом упита.

Руководство са неуспесима и самопоправком

Аутономија Agentic RAG-а укључује и робусне механизме самопоправке. Када систем дође до препрека — као што је преузимање ирелевантних докумената или сусрет са неисправним упитима — он може:

Оваквим итеративним и динамичним приступом модел непрестано напредује, обезбеђујући да није систем једнократног покретања већ да учи из својих грешака током дате сесије.

Self Correction Mechanism

Границе агентства

Упркос својој аутономији у оквиру задатка, Agentic RAG није синоним за Општу Вештачку Интелигенцију. Његове „агентске“ способности ограничене су на алате, изворе података и политике које су обезбедили људски програмери. Не може измислити своје алате нити изаћи изван постављених доменских граница. Уместо тога, одличан је у динамичкој оркестрацији доступних ресурса. Кључне разлике у односу на напредније облике AI укључују:

  1. Аутономија специфична за домен: Agentic RAG системи се фокусирају на постизање кориснички дефинисаних циљева у познатом домену, користећи стратегије као што су преписивање упита или избор алата ради побољшања резултата.
  2. Зависност од инфраструктуре: Капацитети система зависе од алата и података интегрисаних од стране програмера. Не може превазићи ове границе без људске интервенције.
  3. Поштовање контролних механизама: Етичка упутства, правила о усаглашености и пословне политике су и даље веома важни. Слобода агента је увек ограничена мерама безбедности и механизмима надзора (надамо се).

Практичне примене и вредност

Agentic RAG се истиче у сценаријима који захтевају итеративно унапређење и прецизност:

  1. Окружења са приоритетом на исправности: У проверама усаглашености, регулаторним анализама или правним истраживањима, агентски модел може вишеструко проверавати чињенице, консултовати више извора и преписивати упите док не произведе темељно проверен одговор.
  2. Комплексне интеракције са базама података: Када се ради са структурираним подацима где упити често могу да не успевају или захтевају прилагођавање, систем може аутономно унапредити упите користећи Azure SQL или Microsoft Fabric OneLake, осигуравајући да коначна добијена информација одговара корисничкој намери.
  3. Продужени токови рада: Дуго трајуће сесије могу се развијати како нове информације постају доступне. Agentic RAG може континуирано укључивати нове податке, мењајући стратегије како учи више о проблему.

Управљање, транспарентност и поверење

Како системи постају самосталнији у свом размишљању, управљање и транспарентност постају кључни:

Поседовање алата који пружају јасан запис акција је неопходно. Без њих, дебаговање вишестепеног процеса може бити веома тешко. Погледајте следећи пример из Literal AI (компанија иза Chainlit) за AgentRun:

AgentRunExample

Закључак

Agentic RAG представља природну еволуцију у начину на који AI системи управљају сложеним, подацима интензивним задацима. Усвајањем петљастог образца интеракције, аутономним избором алата и унапређењем упита све док се не постигне квалитетан резултат, систем прелази из статика праћења упита у прилагодљивији, свестан контекста донoсиoc одлука. Иако остаје ограничен инфраструктурама и етичким смерницама које дефинишу људи, ове агентске способности омогућавају богатије, динамичније и на крају корисније AI интеракције и за предузећа и за крајње кориснике.

Имате још питања о Agentic RAG?

Придружите се Microsoft Foundry Discord да упознате друге ученике, присуствујете сатовима за питања и добијете одговоре о AI агенатима.

Додатни ресурси

Академски радови

Претходна лекција

Tool Use Design Pattern

Следећа лекција

Building Trustworthy AI Agents


Одрицање одговорности:
Овај документ је преведен коришћењем AI услуге за превођење Co-op Translator. Иако тежимо тачности, имајте на уму да аутоматски преводи могу садржати грешке или нетачности. Оригинални документ на свом изворном језику треба сматрати ауторитетним извором. За важне информације препоруучује се професионални превод од стране људи. Не одговарамо за било каква неспоразума или погрешна тумачења која произилазе из коришћења овог превода.