
(Кликните на горњу слику да бисте видели видео о овом часу)
Agentic RAG
Овај час пружа свеобухватан преглед Agentic Retrieval-Augmented Generation (Agentic RAG), новог парадигма вештачке интелигенције у коме велики језички модели (LLMs) аутономно планирају своје наредне кораке док прикупљају информације из спољашњих извора. За разлику од статичних модела са приступом „преузми-па-прочитај“, Agentic RAG укључује итеративне позиве LLM-у, испресецане позивима алата или функција и структуриране излазе. Систем процењује резултате, унапређује упите, по потреби позива додатне алате и наставља овај циклус све док не постигне задовољавајуће решење.
Увод
Овај час ће обухватити
- Разумевање Agentic RAG: Научите о новом парадигму у вештачкој интелигенцији где велики језички модели аутономно планирају своје наредне кораке док прикупљају информације из спољашњих извора података.
- Схватање итеративног модела типa „Maker-Checker“: Разумети петљу итеративних позива LLM-у, испресецаних позивима алата или функција и структурираним излазима, дизајнирану да побољша тачност и обради неисправне упите.
- Истраживање практичних примена: Идентификовати сценарије у којима Agentic RAG најбоље делује, као што су окружења са приоритетом на исправности, комплексне интеракције са базама података и продужени токови рада.
Циљеви учења
Након завршетка овог часа, знаћете како да/разумете:
- Разумевање Agentic RAG: Научити о новом парадигму у вештачкој интелигенцији где велики језички модели аутономно планирају своје наредне кораке док прикупљају информације из спољашњих извора података.
- Итеративни модел типa „Maker-Checker“: Схватити концепт петље итеративних позива LLM-у, са позивима алата или функција и структурираним излазима, дизајниране да побољша тачност и обради неисправне упите.
- Власништво над процесом размишљања: Разумети системску способност да поседује свој процес размишљања, доносећи одлуке о приступу проблемима без ослањања на унапред дефинисане путеве.
- Ток рада: Разумети како агенцијски модел независно одлучује да преузме извештаје о трендовима на тржишту, идентификује податке о конкурентима, корелише унутрашње показатеље продаје, синтетише налазе и процењује стратегију.
- Итеративне петље, интеграција алата и меморија: Научити о ослањању система на итеративни образац интеракције, одржавајући стање и меморију преко корака да избегне понављање и доноси информисане одлуке.
- Ручавање са неуспесима и самопоправка: Истражити робусне механизме самопоправке система, укључујући итерације и поновне упите, коришћење дијагностичких алата и ослањање на људски надзор.
- Границе агентства: Разумети ограничења Agentic RAG-а, са фокусом на аутономију специфичну за домен, зависност од инфраструктуре и поштовање контролних механизама.
- Практичне примене и вредност: Идентификовати сценарије у којима Agentic RAG најбоље делује, као што су окружења са приоритетом на исправности, комплексне интеракције са базама података и продужени токови рада.
- Управљање, транспарентност и поверење: Научити о важности управљања и транспарентности, укључујући објашњиво размишљање, контролу пристрасности и људски надзор.
Шта је Agentic RAG?
Agentic Retrieval-Augmented Generation (Agentic RAG) је нови парадигма у вештачкој интелигенцији која омогућава великим језичким моделима (LLMs) да аутономно планирају своје наредне кораке док прикупљају информације из спољашњих извора. За разлику од статичних „преузми-па-прочитај“ модела, Agentic RAG укључује итеративне позиве LLM-у, испресецане коришћењем алата или функција и структурираним излазима. Систем процењује резултате, унапређује упите, по потреби позива додатне алате и наставља овај циклус све док не постигне задовољавајуће решење. Ова итеративна„maker-checker“ метода побољшава тачност, обрађује неисправне упите и обезбеђује резултате високе квалитете.
Систем активно поседује свој процес размишљања, преписује неуспеле упите, бира различите методе претраживања и интегрише више алата — као што су претраживање вектором у Azure AI Search, SQL базе података или прилагођени API-ји — пре него што финализује одговор. Карактеристика која издваја агентски систем је његова способност да контролише свој процес расуђивања. Традиционалне RAG имплементације зависе од унапред дефинисаних путања, али агентски систем аутономно одређује низ корака на основу квалитета пронађених информација.
Дефинисање Agentic Retrieval-Augmented Generation (Agentic RAG)
Agentic Retrieval-Augmented Generation (Agentic RAG) је нова AI парадигма где LLM-ови не само да преузимају информације из спољашњих извора података већ аутономно планирају своје следеће кораке. За разлику од статичних модела „преузми-па-прочитај“ или пажљиво скриптованих низа упита, Agentic RAG укључује петљу итеративних позива LLM-у, испресецану позивима алата или функција и структуираним излазима. На сваком кораку, систем процењује резултате, одлучује да ли треба унапредити упите, позива додатне алате по потреби, и наставља овај процес све док не постигне задовољавајуће решење.
Ова итеративна „maker-checker“ метода је дизајнирана да побољша тачност, обради неисправне упите ка структурираним базама података (нпр. NL2SQL) и обезбеди уравнотежене, квалитетне резултате. Уместо ослањања само на пажљиво осмишљене ланце упита, систем активно контролише свој процес размишљања. Може преписивати упите који не успевају, бирати различите методе претраживања и интегрисати више алата — као што су претраживање вектора у Azure AI Search, SQL базе података или прилагођени API-ји — пре него што финализује одговор. Ово уклања потребу за прекомпликованим системима оркестрације. Уместо тога, релативно једноставна петља „позив LLM → коришћење алата → позив LLM → …“ може произвести софистициране и добро утемељене резултате.

Власништво над процесом размишљања
Карактеристика која систем чини „агентским“ јесте његова способност да контролише свој процес размишљања. Традиционалне RAG имплементације често зависе од тога да људи унапред дефинишу пут за модел: ланац размишљања који одређује шта и када треба преузети.
Али када је систем заиста агентски, он унутрашње одлучује како да приступи проблему. Он не извршава само скрипту; аутономно одређује низ корака на основу квалитета информација које пронађе.
На пример, ако му се затражи да креира стратегију лансирања производа, он се не ослања само на упит који описује цели процес истраживања и доношења одлука. Уместо тога, агентски модел независно одлучује да:
- Преузме тренутне извештаје о тржишним трендовима користећи Bing Web Grounding
- Идентификује релевантне податке о конкурентима користећи Azure AI Search.
- Корелира историјске унутрашње показатеље продаје користећи Azure SQL Database.
- Синтетише налазе у кохезивну стратегију коју оркестрира Azure OpenAI Service.
- Процењује стратегију тражећи празнине или неусклађености, подстичући још један круг преузимања ако је потребно.
Све ове кораке — унапређивање упита, избор извора, итерација све док не буде „задовољан“ одговором — одлучује модел, а не човек који је направио скрипту.
Итеративне петље, интеграција алата и меморија

Агентски систем се ослања на петљасти образац интеракције:
- Почетни позив: Циљ корисника (такозвани кориснички упит) се прослеђује LLM-у.
- Позив алата: Ако модел идентификује недостатак информација или неодређене инструкције, бира алат или метод претраживања — као што је упит на векторској бази података (нпр. Azure AI Search Hybrid претраживање приватних података) или структурирани SQL позив — да прикупи више контекста.
- Процена и унапређење: Након прегледа добијених података, модел одлучује да ли су информације довољне. Ако нису, унапређује упит, покушава други алат или прилагођава приступ.
- Понављати док не буде задовољан: Овај циклус се наставља док модел не процени да има довољно јасноће и доказа за давање коначног, добро образложеног одговора.
- Меморија и стање: Пошто систем одржава стање и меморију кроз кораке, може се сећати претходних покушаја и њихових резултата, избегавајући понављајуће петље и доносећи информисаније одлуке.
Временом, ово ствара осећај еволуирајућег разумевања, омогућавајући моделу да навигира кроз сложене, вишекорачне задатке без потребе за сталном људском интервенцијом или променом упита.
Руководство са неуспесима и самопоправком
Аутономија Agentic RAG-а укључује и робусне механизме самопоправке. Када систем дође до препрека — као што је преузимање ирелевантних докумената или сусрет са неисправним упитима — он може:
- Итеративно поновити упит: Уместо да враћа одговоре са малом вредношћу, модел покушава нове стратегије претраге, преписује упите базе података или гледа алтернативне скупове података.
- Користити дијагностичке алате: Систем може позвати додатне функције дизајниране да му помогну у дијагностици корака размишљања или потврде исправност преузетих података. Алати као Azure AI Tracing биће важни за омогућавање робусне посматрачности и надзора.
- Ослањати се на људски надзор: За критичне или понављајуће неуспеле сценарије модел може означити неизвесност и затражити људско вођство. Када човек пружи корективне повратне информације, модел може укључити то учење у даљем раду.
Оваквим итеративним и динамичним приступом модел непрестано напредује, обезбеђујући да није систем једнократног покретања већ да учи из својих грешака током дате сесије.

Границе агентства
Упркос својој аутономији у оквиру задатка, Agentic RAG није синоним за Општу Вештачку Интелигенцију. Његове „агентске“ способности ограничене су на алате, изворе података и политике које су обезбедили људски програмери. Не може измислити своје алате нити изаћи изван постављених доменских граница. Уместо тога, одличан је у динамичкој оркестрацији доступних ресурса.
Кључне разлике у односу на напредније облике AI укључују:
- Аутономија специфична за домен: Agentic RAG системи се фокусирају на постизање кориснички дефинисаних циљева у познатом домену, користећи стратегије као што су преписивање упита или избор алата ради побољшања резултата.
- Зависност од инфраструктуре: Капацитети система зависе од алата и података интегрисаних од стране програмера. Не може превазићи ове границе без људске интервенције.
- Поштовање контролних механизама: Етичка упутства, правила о усаглашености и пословне политике су и даље веома важни. Слобода агента је увек ограничена мерама безбедности и механизмима надзора (надамо се).
Практичне примене и вредност
Agentic RAG се истиче у сценаријима који захтевају итеративно унапређење и прецизност:
- Окружења са приоритетом на исправности: У проверама усаглашености, регулаторним анализама или правним истраживањима, агентски модел може вишеструко проверавати чињенице, консултовати више извора и преписивати упите док не произведе темељно проверен одговор.
- Комплексне интеракције са базама података: Када се ради са структурираним подацима где упити често могу да не успевају или захтевају прилагођавање, систем може аутономно унапредити упите користећи Azure SQL или Microsoft Fabric OneLake, осигуравајући да коначна добијена информација одговара корисничкој намери.
- Продужени токови рада: Дуго трајуће сесије могу се развијати како нове информације постају доступне. Agentic RAG може континуирано укључивати нове податке, мењајући стратегије како учи више о проблему.
Управљање, транспарентност и поверење
Како системи постају самосталнији у свом размишљању, управљање и транспарентност постају кључни:
- Објашњиво размишљање: Модел може обезбедити записник о упитима које је направио, изворима које је консултовао и корацима размишљања који су довели до закључка. Алати као Azure AI Content Safety и Azure AI Tracing / GenAIOps могу помоћи у одржавању транспарентности и смањењу ризика.
- Контрола пристрасности и уравнотежено преузимање: Развијачи могу подешавати стратегије претраживања да обезбеде уравнотежене, репрезентативне изворе података и редовно ревидирати излазе како би открили пристрасности или искривљене образце користећи прилагођене моделе намењене напредним организацијама за науку о подацима уз Azure Machine Learning.
- Људски надзор и усаглашеност: За осетљиве задатке, људски преглед остаје есенцијалан. Agentic RAG не замењује људски суд у важним одлукама — већ га допуњује испоруком темељније проверених опција.
Поседовање алата који пружају јасан запис акција је неопходно. Без њих, дебаговање вишестепеног процеса може бити веома тешко. Погледајте следећи пример из Literal AI (компанија иза Chainlit) за AgentRun:

Закључак
Agentic RAG представља природну еволуцију у начину на који AI системи управљају сложеним, подацима интензивним задацима. Усвајањем петљастог образца интеракције, аутономним избором алата и унапређењем упита све док се не постигне квалитетан резултат, систем прелази из статика праћења упита у прилагодљивији, свестан контекста донoсиoc одлука. Иако остаје ограничен инфраструктурама и етичким смерницама које дефинишу људи, ове агентске способности омогућавају богатије, динамичније и на крају корисније AI интеракције и за предузећа и за крајње кориснике.
Имате још питања о Agentic RAG?
Придружите се Microsoft Foundry Discord да упознате друге ученике, присуствујете сатовима за питања и добијете одговоре о AI агенатима.
Додатни ресурси
Академски радови
Претходна лекција
Tool Use Design Pattern
Следећа лекција
Building Trustworthy AI Agents
Одрицање одговорности:
Овај документ је преведен коришћењем AI услуге за превођење Co-op Translator. Иако тежимо тачности, имајте на уму да аутоматски преводи могу садржати грешке или нетачности. Оригинални документ на свом изворном језику треба сматрати ауторитетним извором. За важне информације препоруучује се професионални превод од стране људи. Не одговарамо за било каква неспоразума или погрешна тумачења која произилазе из коришћења овог превода.