
(Кликните на слику изнад да бисте погледали видео овог часа)
Агентски RAG
Овај час пружа свеобухватан преглед Агентског Ретривал-Аугментед Генератион (Agentic RAG), новог АИ парадигме где велики језички модели (LLMs) аутономно планирају своје следеће кораке док прикупљају информације из спољашњих извора. За разлику од статичких образаца “претражи па прочитај”, Agentic RAG укључује итеративне позиве LLM-у, испреплетене са позивима алата или функција и структурисаним излазима. Систем процењује резултате, прецизира упите, позива додатне алате ако је потребно и наставља овај циклус док се не постигне задовољавајуће решење.
Увод
Овај час ће обухватити:
- Разумевање Агентског RAG-а: Упознајте се са новом парадигмом у АИ где велики језички модели (LLMs) аутономно планирају своје следеће кораке док прикупљају информације из спољашњих извора података.
- Схватање итеративног Maker-Checker стила: Разумите циклус итеративних позива LLM-у, испреплетених са позивима алата или функција и структурисаним излазима, дизајнираних да побољшају тачност и реше неисправне упите.
- Истраживање практичних примена: Идентификујте сценарије у којима Agentic RAG блиста, као што су окружења где је тачност приоритет, сложене интеракције са базама података и проширени токови рада.
Циљеви учења
Након завршетка овог часа, знаћете како да/разумете:
- Разумевање Агентског RAG-а: Упознајте се са новом парадигмом у АИ где велики језички модели (LLMs) аутономно планирају своје следеће кораке док прикупљају информације из спољашњих извора података.
- Итеративни Maker-Checker стил: Схватите концепт циклуса итеративних позива LLM-у, испреплетених са позивима алата или функција и структурисаним излазима, дизајнираних да побољшају тачност и реше неисправне упите.
- Поседовање процеса размишљања: Разумите способност система да самостално управља својим процесом размишљања, доносећи одлуке о томе како да приступи проблемима без ослањања на унапред дефинисане путеве.
- Ток рада: Разумите како агентски модел самостално одлучује да преузме извештаје о тржишним трендовима, идентификује податке о конкурентима, корелира интерне продајне метрике, синтетише налазе и процењује стратегију.
- Итеративни циклуси, интеграција алата и меморија: Упознајте се са ослањањем система на обрасце интеракције у циклусима, одржавањем стања и меморије током корака како би се избегли понављајући циклуси и донеле информисане одлуке.
- Руковање модовима неуспеха и самокорекција: Истражите робусне механизме самокорекције система, укључујући итерацију и поновно постављање упита, коришћење дијагностичких алата и ослањање на људски надзор када је потребно.
- Границе агенције: Разумите ограничења Agentic RAG-а, са фокусом на доменску аутономију, зависност од инфраструктуре и поштовање заштитних мера.
- Практични случајеви употребе и вредност: Идентификујте сценарије у којима Agentic RAG блиста, као што су окружења где је тачност приоритет, сложене интеракције са базама података и проширени токови рада.
- Управљање, транспарентност и поверење: Упознајте се са значајем управљања и транспарентности, укључујући објашњиво размишљање, контролу пристрасности и људски надзор.
Шта је Агентски RAG?
Agentic Retrieval-Augmented Generation (Agentic RAG) је нова АИ парадигма где велики језички модели (LLMs) аутономно планирају своје следеће кораке док прикупљају информације из спољашњих извора. За разлику од статичких образаца “претражи па прочитај”, Agentic RAG укључује итеративне позиве LLM-у, испреплетене са позивима алата или функција и структурисаним излазима. Систем процењује резултате, прецизира упите, позива додатне алате ако је потребно и наставља овај циклус док се не постигне задовољавајуће решење. Ова итеративна “maker-checker” метода побољшава тачност, решава неисправне упите и осигурава висококвалитетне резултате.
Систем активно управља својим процесом размишљања, преписујући неуспеле упите, бирајући различите методе претраживања и интегришући више алата—као што су векторска претрага у Azure AI Search, SQL базе података или прилагођени API-ји—пре него што финализује свој одговор. Посебна карактеристика агентског система је његова способност да самостално управља својим процесом размишљања. Традиционалне RAG имплементације ослањају се на унапред дефинисане путеве, али агентски систем аутономно одређује редослед корака на основу квалитета информација које пронађе.
Дефинисање Агентског Ретривал-Аугментед Генератион (Agentic RAG)
Agentic Retrieval-Augmented Generation (Agentic RAG) је нова парадигма у развоју АИ где LLM-ови не само да прикупљају информације из спољашњих извора података већ и аутономно планирају своје следеће кораке. За разлику од статичких образаца “претражи па прочитај” или пажљиво скриптованих секвенци упита, Agentic RAG укључује циклус итеративних позива LLM-у, испреплетених са позивима алата или функција и структурисаним излазима. На сваком кораку, систем процењује добијене резултате, одлучује да ли да прецизира упите, позива додатне алате ако је потребно и наставља овај циклус док не постигне задовољавајуће решење.
Ова итеративна “maker-checker” метода рада дизајнирана је да побољша тачност, реши неисправне упите ка структурисаним базама података (нпр. NL2SQL) и осигура уравнотежене, висококвалитетне резултате. Уместо да се ослања искључиво на пажљиво осмишљене ланце упита, систем активно управља својим процесом размишљања. Може да препише неуспеле упите, изабере различите методе претраживања и интегрише више алата—као што су векторска претрага у Azure AI Search, SQL базе података или прилагођени API-ји—пре него што финализује свој одговор. Ово уклања потребу за превише сложеним оркестрационим оквирима. Уместо тога, релативно једноставан циклус “позив LLM-а → коришћење алата → позив LLM-а → …” може дати софистициране и добро утемељене излазе.

Управљање процесом размишљања
Посебна карактеристика која чини систем “агентским” је његова способност да управља својим процесом размишљања. Традиционалне RAG имплементације често зависе од људи који унапред дефинишу пут за модел: ланац размишљања који одређује шта да се претражи и када.
Али када је систем заиста агентски, он интерно одлучује како да приступи проблему. Не извршава само скрипту; аутономно одређује редослед корака на основу квалитета информација које пронађе.
На пример, ако му се постави задатак да креира стратегију за лансирање производа, он се не ослања искључиво на упит који детаљно описује цео процес истраживања и доношења одлука. Уместо тога, агентски модел самостално одлучује да:
- Преузме извештаје о тренутним тржишним трендовима користећи Bing Web Grounding.
- Идентификује релевантне податке о конкурентима користећи Azure AI Search.
- Корелира историјске интерне продајне метрике користећи Azure SQL Database.
- Синтетише налазе у кохезивну стратегију оркестрирану преко Azure OpenAI Service.
- Процени стратегију за празнине или недоследности, иницирајући још један круг претраживања ако је потребно.
Сви ови кораци—прецизирање упита, избор извора, итерација док модел не буде “задовољан” одговором—одлучује модел, а не човек који је унапред скриптовао процес.
Итеративни циклуси, интеграција алата и меморија

Агентски систем се ослања на образац интеракције у циклусима:
- Почетни позив: Циљ корисника (тј. кориснички упит) се представља LLM-у.
- Позив алата: Ако модел идентификује недостајуће информације или нејасна упутства, бира алат или метод претраживања—као што је упит у векторску базу података (нпр. Azure AI Search Hybrid претрага над приватним подацима) или структурисани SQL позив—да би прикупио више контекста.
- Процена и прецизирање: Након прегледа враћених података, модел одлучује да ли су информације довољне. Ако нису, прецизира упит, испробава други алат или прилагођава свој приступ.
- Понављање док не буде задовољан: Овај циклус се наставља док модел не одлучи да има довољно јасноће и доказа да испоручи коначан, добро образложен одговор.
- Меморија и стање: Пошто систем одржава стање и меморију током корака, може да се сети претходних покушаја и њихових исхода, избегавајући понављајуће циклусе и доносећи информисаније одлуке како напредује.
Током времена, ово ствара осећај еволуирајућег разумевања, омогућавајући моделу да се креће кроз сложене, вишестепене задатке без потребе за сталном људском интервенцијом или обликовањем упита.
Руковање модовима неуспеха и самокорекција
Аутономија Agentic RAG-а такође укључује робусне механизме самокорекције. Када систем наиђе на ћорсокаке—као што је преузимање ирелевантних докумената или наилазак на неисправне упите—може:
- Итерација и поновно постављање упита: Уместо да врати одговоре ниске вредности, модел покушава нове стратегије претраживања, преписује упите за базу података или разматра алтернативне скупове података.
- Коришћење дијагностичких алата: Систем може позвати додатне функције дизајниране да му помогну у отклањању грешака у корацима размишљања или потврди тачност преузетих података. Алати као што је Azure AI Tracing биће важни за омогућавање робусне посматраности и праћења.
- Ослањање на људски надзор: За задатке високог ризика или сценарије који се понављано неуспешно извршавају, модел може означити несигурност и затражити људско вођење. Када човек пружи корективне повратне информације, модел може да укључи ту лекцију у будућем раду.
Ова итеративна и динамична метода омогућава моделу да се континуирано побољшава, осигуравајући да није само систем за једнократну употребу, већ онај који учи из својих грешака током одређене сесије.

Границе агенције
Упркос својој аутономији унутар задатка, Agentic RAG није аналоган вештачкој општој интелигенцији. Његове “агентске” способности су ограничене на алате, изворе података и политике које су обезбедили људски програмери. Не може самостално измишљати нове алате или излазити изван граница домена које су постављене. Уместо тога, одличан је у динамичком оркестрирању расположивих ресурса.
Кључне разлике у односу на напредније облике АИ укључују:
- Доменска аутономија: Agentic RAG системи су фокусирани на постизање циљева које је дефинисао корисник унутар познатог домена, користећи стратегије као што су преписивање упита или избор алата за побољшање резултата.
- Зависност од инфраструктуре: Способности система зависе од алата и података које су интегрисали програмери. Не може превазићи ове границе без људске интервенције.
- Поштовање заштитних мера: Етичке смернице, правила усклађености и пословне политике остају веома важне. Слобода агента је увек ограничена безбедносним мерама и механизмима надзора (надамо се?).
Практични случајеви употребе и вредност
Agentic RAG блиста у сценаријима који захтевају итеративно прецизирање и прецизност:
- Окружења где је тачност приоритет: У проверама усклађености, регулаторним анализама или правним истраживањима, агентски модел може више пута проверавати чињенице, консултовати више извора и преписивати упите док не произведе темељно проверен одговор.
- Сложене интеракције са базама података: Када се ради са структурисаним подацима где упити често могу да не успеју или захтевају прилагођавање, систем може аутономно прецизирати своје упите користећи Azure SQL или Microsoft Fabric OneLake, осигуравајући да коначни резултат одговара намери корисника.
- Проширени токови рада: Дужи токови рада могу се развијати како се појављују нове информације. Agentic RAG може континуирано укључивати нове податке, мењајући стратегије како више сазнаје о проблемском простору.
Управљање, транспарентност и поверење
Како ови системи постају аутономнији у свом размишљању
Implementacija Retrieval Augmented Generation (RAG) са Azure OpenAI Service: Сазнајте како да користите сопствене податке са Azure OpenAI Service. Овај Microsoft Learn модул пружа свеобухватан водич за имплементацију RAG-а
Академски радови
Претходна лекција
Шаблон за дизајн коришћења алата
Наредна лекција
Изградња поузданих AI агената
Одрицање од одговорности:
Овај документ је преведен коришћењем услуге за превођење помоћу вештачке интелигенције Co-op Translator. Иако се трудимо да обезбедимо тачност, молимо вас да имате у виду да аутоматски преводи могу садржати грешке или нетачности. Оригинални документ на његовом изворном језику треба сматрати меродавним извором. За критичне информације препоручује се професионални превод од стране људи. Не преузимамо одговорност за било каква погрешна тумачења или неспоразуме који могу настати услед коришћења овог превода.