ai-agents-for-beginners

Agentic RAG

(Кликнете върху изображението по-горе, за да гледате видеото на този урок)

Agentic RAG

Този урок предоставя изчерпателен преглед на Agentic Retrieval-Augmented Generation (Agentic RAG), нововъзникваща парадигма в AI, при която големите езикови модели (LLMs) автономно планират следващите си стъпки, докато извличат информация от външни източници. За разлика от статичните модели на извличане и четене, Agentic RAG включва итеративни обаждания към LLM, редуващи се с използване на инструменти или функции и структурирани изходи. Системата оценява резултатите, усъвършенства заявките, извиква допълнителни инструменти, ако е необходимо, и продължава този цикъл, докато се постигне задоволително решение.

Въведение

Този урок ще обхване:

Цели на обучението

След завършване на този урок ще знаете как да/разбирате:

Какво е Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) е нововъзникваща парадигма в AI, при която големите езикови модели (LLMs) автономно планират следващите си стъпки, докато извличат информация от външни източници. За разлика от статичните модели на извличане и четене, Agentic RAG включва итеративни обаждания към LLM, редуващи се с използване на инструменти или функции и структурирани изходи. Системата оценява резултатите, усъвършенства заявките, извиква допълнителни инструменти, ако е необходимо, и продължава този цикъл, докато се постигне задоволително решение. Този итеративен стил „maker-checker“ подобрява точността, справя се с неправилно формулирани заявки и гарантира висококачествени резултати.

Системата активно притежава процеса си на разсъждение, пренаписва неуспешни заявки, избира различни методи за извличане и интегрира множество инструменти—като векторно търсене в Azure AI Search, SQL бази данни или персонализирани API—преди да финализира отговора си. Отличителното качество на агентната система е способността й да притежава процеса си на разсъждение. Традиционните RAG реализации разчитат на предварително дефинирани пътища, но агентната система автономно определя последователността от стъпки въз основа на качеството на информацията, която намира.

Дефиниране на Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) е нововъзникваща парадигма в развитието на AI, при която LLMs не само извличат информация от външни източници, но и автономно планират следващите си стъпки. За разлика от статичните модели на извличане и четене или внимателно скриптирани последователности от подсказки, Agentic RAG включва цикъл от итеративни обаждания към LLM, редуващи се с използване на инструменти или функции и структурирани изходи. На всяка стъпка системата оценява получените резултати, решава дали да усъвършенства заявките, извиква допълнителни инструменти, ако е необходимо, и продължава този цикъл, докато постигне задоволително решение.

Този итеративен стил „maker-checker“ е предназначен за подобряване на точността, справяне с неправилно формулирани заявки към структурирани бази данни (например NL2SQL) и гарантиране на балансирани, висококачествени резултати. Вместо да разчита единствено на внимателно проектирани вериги от подсказки, системата активно притежава процеса си на разсъждение. Тя може да пренаписва заявки, които се провалят, да избира различни методи за извличане и да интегрира множество инструменти—като векторно търсене в Azure AI Search, SQL бази данни или персонализирани API—преди да финализира отговора си. Това премахва нуждата от прекалено сложни рамки за оркестрация. Вместо това, сравнително прост цикъл от „LLM обаждане → използване на инструмент → LLM обаждане → …“ може да доведе до сложни и добре обосновани изходи.

Agentic RAG Core Loop

Притежаване на процеса на разсъждение

Отличителното качество, което прави една система „агентна“, е способността й да притежава процеса си на разсъждение. Традиционните RAG реализации често зависят от хората, които предварително дефинират пътя за модела: верига от мисли, която очертава какво да се извлече и кога. Но когато една система е наистина агентна, тя вътрешно решава как да подходи към проблема. Тя не просто изпълнява скрипт; тя автономно определя последователността от стъпки въз основа на качеството на информацията, която намира. Например, ако бъде помолена да създаде стратегия за пускане на продукт, тя не разчита единствено на подсказка, която изписва целия процес на изследване и вземане на решения. Вместо това, агентният модел независимо решава да:

  1. Извлече текущи доклади за пазарни тенденции, използвайки Bing Web Grounding.
  2. Идентифицира подходящи данни за конкуренти, използвайки Azure AI Search.
  3. Корелира исторически вътрешни продажбени метрики, използвайки Azure SQL Database.
  4. Синтезира откритията в цялостна стратегия, оркестрирана чрез Azure OpenAI Service.
  5. Оцени стратегията за пропуски или несъответствия, като подтикне нов кръг от извличане, ако е необходимо. Всички тези стъпки—усъвършенстване на заявки, избор на източници, итерация, докато е „доволна“ от отговора—се решават от модела, а не предварително скриптирани от човек.

Итеративни цикли, интеграция на инструменти и памет

Tool Integration Architecture

Агентната система разчита на цикличен модел на взаимодействие:

С течение на времето това създава усещане за развиващо се разбиране, позволявайки на модела да навигира сложни, многостъпкови задачи, без да изисква човек постоянно да се намесва или променя подсказката.

Справяне с режими на отказ и самокорекция

Автономията на Agentic RAG включва и устойчиви механизми за самокорекция. Когато системата попадне в задънени улици—като извличане на несъответстващи документи или срещане на неправилно формулирани заявки—тя може:

Този итеративен и динамичен подход позволява на модела да се подобрява непрекъснато, гарантирайки, че той не е просто система за еднократна употреба, а такава, която се учи от грешките си по време на дадена сесия.

Self Correction Mechanism

Граници на автономията

Въпреки автономията си в рамките на дадена задача, Agentic RAG не е аналог на изкуствения общ интелект. Неговите „агентни“ способности са ограничени до инструментите, източниците на данни и политиките, предоставени от човешките разработчици. Той не може да изобретява свои собствени инструменти или да излиза извън зададените домейн граници. Вместо това, той превъзхожда в динамично оркестриране на наличните ресурси. Основни разлики от по-напреднали форми на AI включват:

  1. Автономия, специфична за домейна: Системите Agentic RAG са фокусирани върху постигането на цели, дефинирани от потребителя, в известен домейн, използвайки стратегии като пренаписване на заявки или избор на инструменти за подобряване на резултатите.
  2. Зависимост от инфраструктурата: Способностите на системата зависят от инструментите и данните, интегрирани от разработчиците. Тя не може да надхвърли тези граници без човешка намеса.
  3. Уважение към защитните механизми: Етичните насоки, правилата за съответствие и бизнес политиките остават много важни. Свободата на агента винаги е ограничена от мерки за безопасност и механизми за надзор (надяваме се).

Практически случаи на употреба и стойност

Agentic RAG блести в сценарии, изискващи итеративно усъвършенстване и прецизност:

  1. Среди с приоритет на точността: При проверки за съответствие, регулаторен анализ или правни изследвания, агентният модел може многократно да проверява факти, да консултира множество източници и да пренаписва заявки, докато произведе добре проверен отговор.
  2. Сложни взаимодействия с бази данни: При работа със структурирани данни, където заявките често могат да се провалят или да изискват корекция, системата може автономно да усъвършенства заявките си, използвайки Azure SQL или Microsoft Fabric OneLake, гарантирайки, че окончателното извличане съответства на намерението на потребителя.
  3. Удължени работни потоци: По-дълги сесии могат да се развиват, докато се появява нова информация. Agentic RAG може непрекъснато да включва нови данни, променяйки стратегии, докато научава повече за пространството на проблема.

Управление, прозрачност и доверие

С развитието на тези системи към по-голяма автономност в разсъжденията, управлението и прозрачността са от решаващо значение:

Академични статии

Предишен урок

Модел на дизайн за използване на инструменти

Следващ урок

Изграждане на надеждни AI агенти


Отказ от отговорност:
Този документ е преведен с помощта на AI услуга за превод Co-op Translator. Въпреки че се стремим към точност, моля, имайте предвид, че автоматизираните преводи може да съдържат грешки или неточности. Оригиналният документ на неговия роден език трябва да се счита за авторитетен източник. За критична информация се препоръчва професионален човешки превод. Ние не носим отговорност за каквито и да е недоразумения или погрешни интерпретации, произтичащи от използването на този превод.