
(Кликнете върху изображението по-горе, за да гледате видеото на този урок)
Agentic RAG
Този урок предоставя изчерпателен преглед на Agentic Retrieval-Augmented Generation (Agentic RAG), нововъзникваща парадигма в AI, при която големите езикови модели (LLMs) автономно планират следващите си стъпки, докато извличат информация от външни източници. За разлика от статичните модели на извличане и четене, Agentic RAG включва итеративни обаждания към LLM, редуващи се с използване на инструменти или функции и структурирани изходи. Системата оценява резултатите, усъвършенства заявките, извиква допълнителни инструменти, ако е необходимо, и продължава този цикъл, докато се постигне задоволително решение.
Въведение
Този урок ще обхване:
- Разбиране на Agentic RAG: Научете за нововъзникващата парадигма в AI, при която големите езикови модели (LLMs) автономно планират следващите си стъпки, докато извличат информация от външни източници.
- Итеративен стил Maker-Checker: Разберете цикъла на итеративни обаждания към LLM, редуващи се с използване на инструменти или функции и структурирани изходи, предназначени за подобряване на точността и справяне с неправилно формулирани заявки.
- Изследване на практически приложения: Идентифицирайте сценарии, в които Agentic RAG блести, като среди с приоритет на точността, сложни взаимодействия с бази данни и удължени работни потоци.
Цели на обучението
След завършване на този урок ще знаете как да/разбирате:
- Разбиране на Agentic RAG: Научете за нововъзникващата парадигма в AI, при която големите езикови модели (LLMs) автономно планират следващите си стъпки, докато извличат информация от външни източници.
- Итеративен стил Maker-Checker: Разберете концепцията за цикъл на итеративни обаждания към LLM, редуващи се с използване на инструменти или функции и структурирани изходи, предназначени за подобряване на точността и справяне с неправилно формулирани заявки.
- Притежаване на процеса на разсъждение: Разберете способността на системата да притежава процеса на разсъждение, вземайки решения как да подходи към проблемите, без да разчита на предварително дефинирани пътища.
- Работен поток: Разберете как агентният модел независимо решава да извлече доклади за пазарни тенденции, да идентифицира данни за конкуренти, да корелира вътрешни продажбени метрики, да синтезира откритията и да оцени стратегията.
- Итеративни цикли, интеграция на инструменти и памет: Научете за зависимостта на системата от цикличен модел на взаимодействие, поддържайки състояние и памет през стъпките, за да избегне повтарящи се цикли и да взема информирани решения.
- Справяне с режими на отказ и самокорекция: Изследвайте устойчивите механизми за самокорекция на системата, включително итерация и повторно запитване, използване на диагностични инструменти и връщане към човешки надзор.
- Граници на автономията: Разберете ограниченията на Agentic RAG, съсредоточавайки се върху автономията, специфична за домейна, зависимостта от инфраструктурата и уважението към защитните механизми.
- Практически случаи на употреба и стойност: Идентифицирайте сценарии, в които Agentic RAG блести, като среди с приоритет на точността, сложни взаимодействия с бази данни и удължени работни потоци.
- Управление, прозрачност и доверие: Научете за важността на управлението и прозрачността, включително обяснимо разсъждение, контрол на пристрастията и човешки надзор.
Какво е Agentic RAG?
Agentic Retrieval-Augmented Generation (Agentic RAG) е нововъзникваща парадигма в AI, при която големите езикови модели (LLMs) автономно планират следващите си стъпки, докато извличат информация от външни източници. За разлика от статичните модели на извличане и четене, Agentic RAG включва итеративни обаждания към LLM, редуващи се с използване на инструменти или функции и структурирани изходи. Системата оценява резултатите, усъвършенства заявките, извиква допълнителни инструменти, ако е необходимо, и продължава този цикъл, докато се постигне задоволително решение. Този итеративен стил „maker-checker“ подобрява точността, справя се с неправилно формулирани заявки и гарантира висококачествени резултати.
Системата активно притежава процеса си на разсъждение, пренаписва неуспешни заявки, избира различни методи за извличане и интегрира множество инструменти—като векторно търсене в Azure AI Search, SQL бази данни или персонализирани API—преди да финализира отговора си. Отличителното качество на агентната система е способността й да притежава процеса си на разсъждение. Традиционните RAG реализации разчитат на предварително дефинирани пътища, но агентната система автономно определя последователността от стъпки въз основа на качеството на информацията, която намира.
Дефиниране на Agentic Retrieval-Augmented Generation (Agentic RAG)
Agentic Retrieval-Augmented Generation (Agentic RAG) е нововъзникваща парадигма в развитието на AI, при която LLMs не само извличат информация от външни източници, но и автономно планират следващите си стъпки. За разлика от статичните модели на извличане и четене или внимателно скриптирани последователности от подсказки, Agentic RAG включва цикъл от итеративни обаждания към LLM, редуващи се с използване на инструменти или функции и структурирани изходи. На всяка стъпка системата оценява получените резултати, решава дали да усъвършенства заявките, извиква допълнителни инструменти, ако е необходимо, и продължава този цикъл, докато постигне задоволително решение.
Този итеративен стил „maker-checker“ е предназначен за подобряване на точността, справяне с неправилно формулирани заявки към структурирани бази данни (например NL2SQL) и гарантиране на балансирани, висококачествени резултати. Вместо да разчита единствено на внимателно проектирани вериги от подсказки, системата активно притежава процеса си на разсъждение. Тя може да пренаписва заявки, които се провалят, да избира различни методи за извличане и да интегрира множество инструменти—като векторно търсене в Azure AI Search, SQL бази данни или персонализирани API—преди да финализира отговора си. Това премахва нуждата от прекалено сложни рамки за оркестрация. Вместо това, сравнително прост цикъл от „LLM обаждане → използване на инструмент → LLM обаждане → …“ може да доведе до сложни и добре обосновани изходи.

Притежаване на процеса на разсъждение
Отличителното качество, което прави една система „агентна“, е способността й да притежава процеса си на разсъждение. Традиционните RAG реализации често зависят от хората, които предварително дефинират пътя за модела: верига от мисли, която очертава какво да се извлече и кога.
Но когато една система е наистина агентна, тя вътрешно решава как да подходи към проблема. Тя не просто изпълнява скрипт; тя автономно определя последователността от стъпки въз основа на качеството на информацията, която намира.
Например, ако бъде помолена да създаде стратегия за пускане на продукт, тя не разчита единствено на подсказка, която изписва целия процес на изследване и вземане на решения. Вместо това, агентният модел независимо решава да:
- Извлече текущи доклади за пазарни тенденции, използвайки Bing Web Grounding.
- Идентифицира подходящи данни за конкуренти, използвайки Azure AI Search.
- Корелира исторически вътрешни продажбени метрики, използвайки Azure SQL Database.
- Синтезира откритията в цялостна стратегия, оркестрирана чрез Azure OpenAI Service.
- Оцени стратегията за пропуски или несъответствия, като подтикне нов кръг от извличане, ако е необходимо.
Всички тези стъпки—усъвършенстване на заявки, избор на източници, итерация, докато е „доволна“ от отговора—се решават от модела, а не предварително скриптирани от човек.
Итеративни цикли, интеграция на инструменти и памет

Агентната система разчита на цикличен модел на взаимодействие:
- Първоначално обаждане: Целта на потребителя (т.е. потребителската подсказка) се представя на LLM.
- Извикване на инструменти: Ако моделът идентифицира липсваща информация или неясни инструкции, той избира инструмент или метод за извличане—като заявка към векторна база данни (например Azure AI Search Hybrid search върху частни данни) или структурирано SQL обаждане—за да събере повече контекст.
- Оценка и усъвършенстване: След преглед на върнатите данни, моделът решава дали информацията е достатъчна. Ако не, той усъвършенства заявката, опитва различен инструмент или коригира подхода си.
- Повторение до удовлетворение: Този цикъл продължава, докато моделът определи, че има достатъчно яснота и доказателства, за да предостави окончателен, добре обоснован отговор.
- Памет и състояние: Тъй като системата поддържа състояние и памет през стъпките, тя може да си припомни предишни опити и техните резултати, избягвайки повтарящи се цикли и вземайки по-информирани решения, докато напредва.
С течение на времето това създава усещане за развиващо се разбиране, позволявайки на модела да навигира сложни, многостъпкови задачи, без да изисква човек постоянно да се намесва или променя подсказката.
Справяне с режими на отказ и самокорекция
Автономията на Agentic RAG включва и устойчиви механизми за самокорекция. Когато системата попадне в задънени улици—като извличане на несъответстващи документи или срещане на неправилно формулирани заявки—тя може:
- Итерация и повторно запитване: Вместо да връща отговори с ниска стойност, моделът опитва нови стратегии за търсене, пренаписва заявки към бази данни или разглежда алтернативни набори от данни.
- Използване на диагностични инструменти: Системата може да извика допълнителни функции, предназначени да й помогнат да отстрани грешки в стъпките на разсъждение или да потвърди точността на извлечените данни. Инструменти като Azure AI Tracing ще бъдат важни за осигуряване на устойчиво наблюдение и мониторинг.
- Връщане към човешки надзор: За сценарии с висок риск или многократно провалящи се, моделът може да сигнализира за несигурност и да поиска човешко ръководство. След като човек предостави корективна обратна връзка, моделът може да включи този урок в бъдеще.
Този итеративен и динамичен подход позволява на модела да се подобрява непрекъснато, гарантирайки, че той не е просто система за еднократна употреба, а такава, която се учи от грешките си по време на дадена сесия.

Граници на автономията
Въпреки автономията си в рамките на дадена задача, Agentic RAG не е аналог на изкуствения общ интелект. Неговите „агентни“ способности са ограничени до инструментите, източниците на данни и политиките, предоставени от човешките разработчици. Той не може да изобретява свои собствени инструменти или да излиза извън зададените домейн граници. Вместо това, той превъзхожда в динамично оркестриране на наличните ресурси.
Основни разлики от по-напреднали форми на AI включват:
- Автономия, специфична за домейна: Системите Agentic RAG са фокусирани върху постигането на цели, дефинирани от потребителя, в известен домейн, използвайки стратегии като пренаписване на заявки или избор на инструменти за подобряване на резултатите.
- Зависимост от инфраструктурата: Способностите на системата зависят от инструментите и данните, интегрирани от разработчиците. Тя не може да надхвърли тези граници без човешка намеса.
- Уважение към защитните механизми: Етичните насоки, правилата за съответствие и бизнес политиките остават много важни. Свободата на агента винаги е ограничена от мерки за безопасност и механизми за надзор (надяваме се).
Практически случаи на употреба и стойност
Agentic RAG блести в сценарии, изискващи итеративно усъвършенстване и прецизност:
- Среди с приоритет на точността: При проверки за съответствие, регулаторен анализ или правни изследвания, агентният модел може многократно да проверява факти, да консултира множество източници и да пренаписва заявки, докато произведе добре проверен отговор.
- Сложни взаимодействия с бази данни: При работа със структурирани данни, където заявките често могат да се провалят или да изискват корекция, системата може автономно да усъвършенства заявките си, използвайки Azure SQL или Microsoft Fabric OneLake, гарантирайки, че окончателното извличане съответства на намерението на потребителя.
- Удължени работни потоци: По-дълги сесии могат да се развиват, докато се появява нова информация. Agentic RAG може непрекъснато да включва нови данни, променяйки стратегии, докато научава повече за пространството на проблема.
Управление, прозрачност и доверие
С развитието на тези системи към по-голяма автономност в разсъжденията, управлението и прозрачността са от решаващо значение:
- Обяснимо разсъждение: Моделът може да предостави одитна следа на направените заявки, консултираните източници и стъпките на разсъждение, които е предприел, за да достигне до заключението си. Инструменти като Azure AI Content Safety и Azure AI Tracing / GenAIOps могат да помогнат за поддържане на прозрачност и смекчаване на рисковете.
- Контрол на пристрастията и балансирано извличане: Разработчиците могат да настройват стратегии за извличане, за да гарантират, че се разглеждат балансирани, представителни източници на данни, и редовно да одитират изходите, за да откриват пристрастия или изкривени модели, използвайки персонализирани модели за напреднали организации за данни, използващи Azure Machine
Реализиране на Retrieval Augmented Generation (RAG) с Azure OpenAI Service: Научете как да използвате собствените си данни с Azure OpenAI Service. Този модул на Microsoft Learn предоставя изчерпателно ръководство за внедряване на RAG
- Оценка на приложения за генеративен AI с Azure AI Foundry: Тази статия обхваща оценката и сравнението на модели върху публично достъпни набори от данни, включително приложения Agentic AI и архитектури RAG
- Какво е Agentic RAG | Weaviate
- Agentic RAG: Пълно ръководство за базирано на агенти Retrieval Augmented Generation – Новини от поколението RAG
- Agentic RAG: ускорете вашия RAG с преформулиране на заявки и самообучение! Hugging Face Open-Source AI Cookbook
- Добавяне на агентни слоеве към RAG
- Бъдещето на асистентите за знания: Джери Лиу
- Как да изградим системи Agentic RAG
- Използване на Azure AI Foundry Agent Service за мащабиране на вашите AI агенти
Академични статии
Предишен урок
Модел на дизайн за използване на инструменти
Следващ урок
Изграждане на надеждни AI агенти
Отказ от отговорност:
Този документ е преведен с помощта на AI услуга за превод Co-op Translator. Въпреки че се стремим към точност, моля, имайте предвид, че автоматизираните преводи може да съдържат грешки или неточности. Оригиналният документ на неговия роден език трябва да се счита за авторитетен източник. За критична информация се препоръчва професионален човешки превод. Ние не носим отговорност за каквито и да е недоразумения или погрешни интерпретации, произтичащи от използването на този превод.