ai-agents-for-beginners

Agentic RAG

(Кликните на слику изнад да бисте погледали видео овог часа)

Агентски RAG

Овај час пружа свеобухватан преглед Агентског Ретривал-Аугментед Генератион (Agentic RAG), новог АИ парадигме где велики језички модели (LLMs) аутономно планирају своје следеће кораке док прикупљају информације из спољашњих извора. За разлику од статичких образаца “претражи па прочитај”, Agentic RAG укључује итеративне позиве LLM-у, испреплетене са позивима алата или функција и структурисаним излазима. Систем процењује резултате, прецизира упите, позива додатне алате ако је потребно и наставља овај циклус док се не постигне задовољавајуће решење.

Увод

Овај час ће обухватити:

Циљеви учења

Након завршетка овог часа, знаћете како да/разумете:

Шта је Агентски RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) је нова АИ парадигма где велики језички модели (LLMs) аутономно планирају своје следеће кораке док прикупљају информације из спољашњих извора. За разлику од статичких образаца “претражи па прочитај”, Agentic RAG укључује итеративне позиве LLM-у, испреплетене са позивима алата или функција и структурисаним излазима. Систем процењује резултате, прецизира упите, позива додатне алате ако је потребно и наставља овај циклус док се не постигне задовољавајуће решење. Ова итеративна “maker-checker” метода побољшава тачност, решава неисправне упите и осигурава висококвалитетне резултате.

Систем активно управља својим процесом размишљања, преписујући неуспеле упите, бирајући различите методе претраживања и интегришући више алата—као што су векторска претрага у Azure AI Search, SQL базе података или прилагођени API-ји—пре него што финализује свој одговор. Посебна карактеристика агентског система је његова способност да самостално управља својим процесом размишљања. Традиционалне RAG имплементације ослањају се на унапред дефинисане путеве, али агентски систем аутономно одређује редослед корака на основу квалитета информација које пронађе.

Дефинисање Агентског Ретривал-Аугментед Генератион (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) је нова парадигма у развоју АИ где LLM-ови не само да прикупљају информације из спољашњих извора података већ и аутономно планирају своје следеће кораке. За разлику од статичких образаца “претражи па прочитај” или пажљиво скриптованих секвенци упита, Agentic RAG укључује циклус итеративних позива LLM-у, испреплетених са позивима алата или функција и структурисаним излазима. На сваком кораку, систем процењује добијене резултате, одлучује да ли да прецизира упите, позива додатне алате ако је потребно и наставља овај циклус док не постигне задовољавајуће решење.

Ова итеративна “maker-checker” метода рада дизајнирана је да побољша тачност, реши неисправне упите ка структурисаним базама података (нпр. NL2SQL) и осигура уравнотежене, висококвалитетне резултате. Уместо да се ослања искључиво на пажљиво осмишљене ланце упита, систем активно управља својим процесом размишљања. Може да препише неуспеле упите, изабере различите методе претраживања и интегрише више алата—као што су векторска претрага у Azure AI Search, SQL базе података или прилагођени API-ји—пре него што финализује свој одговор. Ово уклања потребу за превише сложеним оркестрационим оквирима. Уместо тога, релативно једноставан циклус “позив LLM-а → коришћење алата → позив LLM-а → …” може дати софистициране и добро утемељене излазе.

Agentic RAG Core Loop

Управљање процесом размишљања

Посебна карактеристика која чини систем “агентским” је његова способност да управља својим процесом размишљања. Традиционалне RAG имплементације често зависе од људи који унапред дефинишу пут за модел: ланац размишљања који одређује шта да се претражи и када.
Али када је систем заиста агентски, он интерно одлучује како да приступи проблему. Не извршава само скрипту; аутономно одређује редослед корака на основу квалитета информација које пронађе.
На пример, ако му се постави задатак да креира стратегију за лансирање производа, он се не ослања искључиво на упит који детаљно описује цео процес истраживања и доношења одлука. Уместо тога, агентски модел самостално одлучује да:

  1. Преузме извештаје о тренутним тржишним трендовима користећи Bing Web Grounding.
  2. Идентификује релевантне податке о конкурентима користећи Azure AI Search.
  3. Корелира историјске интерне продајне метрике користећи Azure SQL Database.
  4. Синтетише налазе у кохезивну стратегију оркестрирану преко Azure OpenAI Service.
  5. Процени стратегију за празнине или недоследности, иницирајући још један круг претраживања ако је потребно.
    Сви ови кораци—прецизирање упита, избор извора, итерација док модел не буде “задовољан” одговором—одлучује модел, а не човек који је унапред скриптовао процес.

Итеративни циклуси, интеграција алата и меморија

Tool Integration Architecture

Агентски систем се ослања на образац интеракције у циклусима:

Током времена, ово ствара осећај еволуирајућег разумевања, омогућавајући моделу да се креће кроз сложене, вишестепене задатке без потребе за сталном људском интервенцијом или обликовањем упита.

Руковање модовима неуспеха и самокорекција

Аутономија Agentic RAG-а такође укључује робусне механизме самокорекције. Када систем наиђе на ћорсокаке—као што је преузимање ирелевантних докумената или наилазак на неисправне упите—може:

Ова итеративна и динамична метода омогућава моделу да се континуирано побољшава, осигуравајући да није само систем за једнократну употребу, већ онај који учи из својих грешака током одређене сесије.

Self Correction Mechanism

Границе агенције

Упркос својој аутономији унутар задатка, Agentic RAG није аналоган вештачкој општој интелигенцији. Његове “агентске” способности су ограничене на алате, изворе података и политике које су обезбедили људски програмери. Не може самостално измишљати нове алате или излазити изван граница домена које су постављене. Уместо тога, одличан је у динамичком оркестрирању расположивих ресурса.
Кључне разлике у односу на напредније облике АИ укључују:

  1. Доменска аутономија: Agentic RAG системи су фокусирани на постизање циљева које је дефинисао корисник унутар познатог домена, користећи стратегије као што су преписивање упита или избор алата за побољшање резултата.
  2. Зависност од инфраструктуре: Способности система зависе од алата и података које су интегрисали програмери. Не може превазићи ове границе без људске интервенције.
  3. Поштовање заштитних мера: Етичке смернице, правила усклађености и пословне политике остају веома важне. Слобода агента је увек ограничена безбедносним мерама и механизмима надзора (надамо се?).

Практични случајеви употребе и вредност

Agentic RAG блиста у сценаријима који захтевају итеративно прецизирање и прецизност:

  1. Окружења где је тачност приоритет: У проверама усклађености, регулаторним анализама или правним истраживањима, агентски модел може више пута проверавати чињенице, консултовати више извора и преписивати упите док не произведе темељно проверен одговор.
  2. Сложене интеракције са базама података: Када се ради са структурисаним подацима где упити често могу да не успеју или захтевају прилагођавање, систем може аутономно прецизирати своје упите користећи Azure SQL или Microsoft Fabric OneLake, осигуравајући да коначни резултат одговара намери корисника.
  3. Проширени токови рада: Дужи токови рада могу се развијати како се појављују нове информације. Agentic RAG може континуирано укључивати нове податке, мењајући стратегије како више сазнаје о проблемском простору.

Управљање, транспарентност и поверење

Како ови системи постају аутономнији у свом размишљању Implementacija Retrieval Augmented Generation (RAG) са Azure OpenAI Service: Сазнајте како да користите сопствене податке са Azure OpenAI Service. Овај Microsoft Learn модул пружа свеобухватан водич за имплементацију RAG-а

Академски радови

Претходна лекција

Шаблон за дизајн коришћења алата

Наредна лекција

Изградња поузданих AI агената


Одрицање од одговорности:
Овај документ је преведен коришћењем услуге за превођење помоћу вештачке интелигенције Co-op Translator. Иако се трудимо да обезбедимо тачност, молимо вас да имате у виду да аутоматски преводи могу садржати грешке или нетачности. Оригинални документ на његовом изворном језику треба сматрати меродавним извором. За критичне информације препоручује се професионални превод од стране људи. Не преузимамо одговорност за било каква погрешна тумачења или неспоразуме који могу настати услед коришћења овог превода.