ai-agents-for-beginners

Agentic RAG

(Кликните на слику изнад да бисте погледали видео лекције)

Агентски RAG

Ова лекција пружа свеобухватан преглед Агентског Ретривал-Аугментед Генератион (Agentic RAG), новог АИ парадигма у којем велики језички модели (LLMs) аутономно планирају своје наредне кораке док прикупљају информације из спољашњих извора. За разлику од статичких образаца „претражи па прочитај“, Agentic RAG укључује итеративне позиве LLM-у, испреплетене са позивима алатима или функцијама и структурираним излазима. Систем процењује резултате, усавршава упите, позива додатне алате ако је потребно и наставља овај циклус док не постигне задовољавајуће решење.

Увод

Ова лекција ће обухватити:

Циљеви учења

Након завршетка ове лекције, знаћете како да/разумете:

Шта је Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) је нови АИ парадигм у којем велики језички модели (LLMs) аутономно планирају своје наредне кораке док прикупљају информације из спољашњих извора. За разлику од статичких образаца „претражи па прочитај“, Agentic RAG укључује итеративне позиве LLM-у, испреплетене са позивима алатима или функцијама и структурираним излазима. Систем процењује резултате, усавршава упите, позива додатне алате ако је потребно и наставља овај циклус док не постигне задовољавајуће решење. Ова итеративна „maker-checker“ метода побољшава тачност, решава неисправне упите и осигурава висококвалитетне резултате.

Систем активно управља својим процесом размишљања, преписујући неуспеле упите, бирајући различите методе претраживања и интегришући више алата—као што су векторско претраживање у Azure AI Search, SQL базе података или прилагођени API-ји—пре него што финализује свој одговор. Карактеристика која разликује агентски систем је његова способност да самостално управља процесом размишљања. Традиционалне RAG имплементације ослањају се на унапред дефинисане путеве, али агентски систем аутономно одређује редослед корака на основу квалитета информација које проналази.

Дефинисање Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) је нови парадигм у развоју АИ где LLM-ови не само да прикупљају информације из спољашњих извора података већ и аутономно планирају своје наредне кораке. За разлику од статичких образаца „претражи па прочитај“ или пажљиво скриптованих секвенци упита, Agentic RAG укључује циклус итеративних позива LLM-у, испреплетених са позивима алатима или функцијама и структурираним излазима. На сваком кораку, систем процењује добијене резултате, одлучује да ли да усаврши упите, позива додатне алате ако је потребно и наставља овај циклус док не постигне задовољавајуће решење.

Ова итеративна „maker-checker“ метода рада дизајнирана је да побољша тачност, реши неисправне упите ка структурираним базама података (нпр. NL2SQL) и осигура уравнотежене, висококвалитетне резултате. Уместо да се ослања искључиво на пажљиво осмишљене ланце упита, систем активно управља својим процесом размишљања. Може да препише неуспеле упите, изабере различите методе претраживања и интегрише више алата—као што су векторско претраживање у Azure AI Search, SQL базе података или прилагођени API-ји—пре него што финализује свој одговор. Ово уклања потребу за превише сложеним оркестрационим оквирима. Уместо тога, релативно једноставан циклус „позив LLM-у → коришћење алата → позив LLM-у → …“ може дати софистициране и добро утемељене излазе.

Agentic RAG Core Loop

Управљање процесом размишљања

Карактеристика која чини систем „агентским“ је његова способност да самостално управља процесом размишљања. Традиционалне RAG имплементације често зависе од људи који унапред дефинишу пут за модел: ланац размишљања који одређује шта да се прикупи и када.
Али када је систем заиста агентски, он интерно одлучује како да приступи проблему. Не извршава само скрипту; аутономно одређује редослед корака на основу квалитета информација које проналази.
На пример, ако се од њега тражи да креира стратегију за лансирање производа, он се не ослања искључиво на упит који детаљно описује цео процес истраживања и доношења одлука. Уместо тога, агентски модел самостално одлучује да:

  1. Прикупи извештаје о тренутним тржишним трендовима користећи Bing Web Grounding.
  2. Идентификује релевантне податке о конкурентима користећи Azure AI Search.
  3. Корелира историјске интерне продајне метрике користећи Azure SQL Database.
  4. Синтетише налазе у кохезивну стратегију оркестрирану преко Azure OpenAI Service.
  5. Процени стратегију у потрази за празнинама или недоследностима, иницирајући још један круг прикупљања података ако је потребно.

Сви ови кораци—усавршавање упита, одабир извора, итерација док не буде „задовољан“ одговором—одлучује модел, а не човек који је унапред дефинисао кораке.

Итеративни циклуси, интеграција алата и меморија

Tool Integration Architecture

Агентски систем се ослања на образац интеракције у циклусима:

Током времена, ово ствара осећај еволуирајућег разумевања, омогућавајући моделу да се креће кроз сложене, вишестепене задатке без потребе за сталном људском интервенцијом или преобликовањем упита.

Руковање модовима неуспеха и самокорекција

Аутономија Agentic RAG-а такође укључује робусне механизме самокорекције. Када систем наиђе на ћорсокак—као што је прикупљање ирелевантних докумената или сусретање са неисправним упитима—може:

Ова итеративна и динамична метода омогућава моделу да се континуирано побољшава, осигуравајући да није само систем за једнократну употребу, већ онај који учи из својих грешака током одређене сесије.

Self Correction Mechanism

Границе аутономије

Упркос својој аутономији у оквиру задатка, Agentic RAG није аналоган вештачкој општој интелигенцији. Његове „агентске“ способности су ограничене на алате, изворе података и политике које су обезбедили људски програмери. Не може измишљати сопствене алате или излазити изван граница домена које су постављене. Уместо тога, одликује се динамичким оркестрирањем расположивих ресурса.
Кључне разлике у односу на напредније облике АИ укључују:

  1. Доменска аутономија: Agentic RAG системи су фокусирани на постизање циљева које је дефинисао корисник унутар познатог домена, користећи стратегије као што су преписивање упита или одабир алата за побољшање резултата.
  2. Зависност од инфраструктуре: Способности система зависе од алата и података које су интегрисали програмери. Не може превазићи те границе без људске интервенције.
  3. Поштовање заштитних мера: Етичке смернице, правила усклађености и пословне политике остају веома важне. Слобода агента је увек ограничена безбедносним мерама и механизмима надзора (надамо се?).

Практични случајеви употребе и вредност

Agentic RAG блиста у сценаријима који захтевају итеративно усавршавање и прецизност:

  1. Окружења где је тачност приоритет: У проверама усклађености, регулаторним анализама или правним истраживањима, агентски модел може више пута проверавати чињенице, консултовати више извора и преписивати упите док не произведе темељно проверен одговор.
  2. Сложене интеракције са базама података: Када се ради са структурираним подацима где упити често могу да не успеју или захтевају прилагођавање, систем може аутономно усавршавати своје упите користећи Azure SQL или Microsoft Fabric OneLake, осигуравајући да коначни резултат одговара намери корисника.
  3. Проширени токови рада: Дужи токови рада могу се развијати како се појављују нове информације. Agentic RAG може континуирано укључивати нове податке, мењајући стратегије како сазнаје више о простору проблема.

Управљање, транспарентност и поверење

Како ови системи постају аутономнији

Академски радови

Претходна лекција

Шаблон за дизајн коришћења алата

Наредна лекција

Изградња поузданих AI агената


Одрицање од одговорности:
Овај документ је преведен коришћењем услуге за превођење помоћу вештачке интелигенције Co-op Translator. Иако настојимо да обезбедимо тачност, молимо вас да имате у виду да аутоматски преводи могу садржати грешке или нетачности. Оригинални документ на изворном језику треба сматрати ауторитативним извором. За критичне информације препоручује се професионални превод од стране људи. Не сносимо одговорност за било каква погрешна тумачења или неспоразуме који могу произаћи из коришћења овог превода.