ai-agents-for-beginners

Agentic RAG

(Кликнете върху изображението по-горе, за да гледате видео на този урок)

Agentic RAG

Този урок предоставя изчерпателен преглед на Agentic Retrieval-Augmented Generation (Agentic RAG), възникваща парадигма в ИИ, при която големи езикови модели (LLM) автономно планират следващите си стъпки, докато извличат информация от външни източници. За разлика от статичните модели за извличане-и-след-това-прочитане, Agentic RAG включва итеративни повиквания към LLM, редуващи се с повиквания на инструменти или функции и структурирани изходи. Системата оценява резултатите, усъвършенства заявките, използва допълнителни инструменти при нужда и продължава този цикъл, докато постигне удовлетворително решение.

Въведение

Този урок ще обхване

Цели на обучението

След завършване на този урок ще знаете как да/ще разбирате:

Какво е Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) е възникваща парадигма в ИИ, при която големи езикови модели (LLM) автономно планират следващите си стъпки, докато извличат информация от външни източници. За разлика от статичните модели за извличане-и-след-това-прочитане, Agentic RAG включва итеративни повиквания към LLM, редуващи се с повиквания на инструменти или функции и структурирани изходи. Системата оценява резултатите, усъвършенства заявките, използва допълнителни инструменти при нужда и продължава този цикъл, докато постигне удовлетворително решение. Този итеративен стил „maker-checker“ подобрява коректността, обработва неправилно форматирани заявки и осигурява висококачествени резултати.

Системата активно поема отговорност за процеса си на разсъждение, пренаписвайки неуспешни заявки, избирайки различни методи за извличане и интегрирайки множество инструменти — като търсене по вектори в Azure AI Search, SQL бази данни или потребителски API—преди да финализира своя отговор. Отличителната черта на агентската система е способността ѝ да поема отговорност за процеса на разсъждение. Традиционните реализации на RAG разчитат на предварително дефинирани пътища, но агентската система автономно определя последователността от стъпки въз основа на качеството на намерената информация.

Дефиниране на Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) е възникваща парадигма в развитието на ИИ, при която LLM не само извличат информация от външни източници на данни, но и автономно планират следващите си стъпки. За разлика от статичните модели извличане-и-след-това-прочитане или внимателно скриптирани последователности на подканите, Agentic RAG включва цикъл от итеративни повиквания към LLM, редуващи се с повиквания на инструменти или функции и структурирани изходи. При всяка стъпка системата оценява получените резултати, решава дали да усъвършенства заявките си, активира допълнителни инструменти при нужда и продължава този цикъл, докато постигне удовлетворително решение.

Този итеративен стил на работа „maker-checker“ е предназначен да подобри коректността, да обработва неправилно форматирани заявки към структурирани бази данни (например NL2SQL) и да осигури балансирани, висококачествени резултати. Вместо да разчита само на внимателно разработени вериги от подканващи съобщения, системата активно поема контрола върху процеса на разсъждение. Тя може да пренаписва провалили се заявки, да избира различни методи за извличане и да интегрира множество инструменти — като търсене по вектори в Azure AI Search, SQL бази данни или потребителски API — преди да финализира своя отговор. Това премахва необходимостта от прекалено сложни рамки за оркестрация. Вместо това, относително прост цикъл „LLM повикване → използване на инструмент → LLM повикване → …“ може да доведе до сложни и добре обосновани изходи.

Agentic RAG Core Loop

Поемане на процеса на разсъждение

Отличителната черта, която прави системата „агентска“, е нейната способност да поема контрола върху процеса на разсъждение. Традиционните реализации на RAG често разчитат на предварително дефиниран от човека път за модела: верига от мисли, която очертава какво да се извлече и кога. Но когато системата е наистина агентска, тя вътрешно решава как да подхожда към проблема. Тя не изпълнява просто скрипт; тя автономно определя последователността от стъпки въз основа на качеството на намерената информация. Например, ако ѝ бъде възложено да създаде стратегия за пускане на продукт, тя не разчита само на подканващо съобщение, което описва целия изследователски и процес на вземане на решения. Вместо това агентският модел независимо решава да:

  1. Извлече текущи доклади за пазарните тенденции с помощта на Bing Web Grounding
  2. Идентифицира релевантни данни за конкуренти чрез Azure AI Search.
  3. Свърже исторически вътрешни показатели за продажби чрез Azure SQL Database.
  4. Синтезира откритията в цялостна стратегия, оркестрирана чрез Azure OpenAI Service.
  5. Оценява стратегията за пропуски или несъответствия, при необходимост инициира нов кръг на извличане. Всички тези стъпки — усъвършенстване на заявки, избор на източници, итерация докато е „доволна“ от отговора — се решават от модела, а не са предварително скриптирани от човек.

Итеративни цикли, интеграция на инструменти и памет

Tool Integration Architecture

Агентската система разчита на модел на циклично взаимодействие:

С течение на времето това създава усещане за развиващо се разбиране, позволявайки на модела да навигира сложни задачи с множество стъпки без нуждата от постоянна човешка намеса или адаптиране на подканващото съобщение.

Обработка на етапи на неуспех и само-корекция

Автономността на Agentic RAG включва също устойчиви механизми за само-корекция. Когато системата срещне безизходици – като извличане на нерелевантни документи или сблъскване с неправилно форматирани заявки – тя може да:

Този итеративен и динамичен подход позволява на модела да се усъвършенства непрекъснато, гарантирайки, че той не е просто еднократна система, а такава, която учи от грешките си в рамките на дадена сесия.

Self Correction Mechanism

Граници на агентността

Въпреки автономността си в рамките на задача, Agentic RAG не е аналогичен на Изкуствен Общ Интелект. Неговите „агентски“ възможности са ограничени до инструментите, източниците на данни и политиките, предоставени от човешките разработчици. Той не може да изобретява свои инструменти или да стъпва извън границите на домейна, които са зададени. Вместо това, той се отличава с динамично оркестриране на наличните ресурси. Ключови разлики спрямо по-напреднали форми на ИИ включват:

  1. Автономия, специфична за домейна: Agentic RAG системите се фокусират върху постигане на определени от потребителя цели в познат домейн, използвайки стратегии като пренаписване на заявки или избор на инструменти за подобряване на резултатите.
  2. Зависимост от инфраструктура: Възможностите на системата зависят от инструментите и данните, интегрирани от разработчиците. Тя не може да надхвърля тези граници без човешка намеса.
  3. Уважение към защитни механизми: Етични насоки, правила за съответствие и бизнес политики остават изключително важни. Свободата на агента винаги е ограничена от мерки за безопасност и механизми за надзор (дано така?).

Практически случаи на употреба и стойност

Agentic RAG се отличава в сценарии, изискващи итеративно усъвършенстване и прецизност:

  1. Среда с приоритет върху коректността: При проверки за съответствие, регулаторен анализ или правни изследвания агентският модел може многократно да проверява факти, да се консултира с множество източници и да пренаписва заявки, докато предостави цялостно проверен отговор.
  2. Сложни взаимодействия с бази данни: При работа със структурирани данни, където заявките често могат да се провалят или се нуждаят от корекции, системата може автономно да усъвършенства заявките си чрез Azure SQL или Microsoft Fabric OneLake, гарантирайки, че крайното извличане съответства на намерението на потребителя.
  3. Разширени работни потоци: По-дълготрайни сесии могат да се развиват с нова информация. Agentic RAG може непрекъснато да интегрира нови данни, като променя стратегии, докато научава повече за проблемната област.

Управление, прозрачност и доверие

Тъй като тези системи стават все по-автономни в разсъжденията си, управлението и прозрачността са от ключово значение:

Наличието на инструменти, които предоставят ясен запис на действията, е от съществено значение. Без тях отстраняването на грешки в многостъпков процес може да бъде много трудно. Вижте следния пример от Literal AI (компанията зад Chainlit) за изпълнение на агент:

AgentRunExample

Заключение

Agentic RAG представлява естествена еволюция в начина, по който ИИ системите обработват сложни, интензивни на данни задачи. Чрез приемане на цикличен модел на взаимодействие, автономно избиране на инструменти и усъвършенстване на заявките докато се постигне висококачествен резултат, системата преминава отвъд статичното следване на подканите към по-адаптивен, контекстно осъзнат направляващ решения. Въпреки че остава ограничена от човешки дефинирани инфраструктури и етични насоки, тези агентски възможности позволяват по-богати, по-динамични и в крайна сметка по-полезни ИИ взаимодействия както за предприятия, така и за крайни потребители.

Имате още въпроси относно Agentic RAG?

Присъединете се към Microsoft Foundry Discord, за да се срещнете с други учащи, да посещавате работни часове и да получите отговори на въпросите си относно AI агенти.

Допълнителни ресурси

Академични статии

Предишен урок

Tool Use Design Pattern

Следващ урок

Building Trustworthy AI Agents


Отказ от отговорност: Този документ е преведен чрез AI преводаческа услуга Co-op Translator. Въпреки че се стремим към точност, моля, имайте предвид, че автоматизираните преводи могат да съдържат грешки или неточности. Оригиналният документ на неговия собствен език трябва да се счита за авторитетен източник. За критична информация се препоръчва професионален човешки превод. Ние не носим отговорност за всякакви недоразумения или неправилни тълкувания, възникнали от използването на този превод.