ai-agents-for-beginners

Agentic RAG

(Натисніть на зображення вище, щоб переглянути відео цього уроку)

Agentic RAG

Цей урок дає всебічний огляд Agentic Retrieval-Augmented Generation (Agentic RAG) — нової парадигми в AI, у якій великі мовні моделі (LLM) автономно планують свої наступні кроки, одночасно витягаючи інформацію з зовнішніх джерел. На відміну від статичних шаблонів «витягни — прочитай», Agentic RAG передбачає ітеративні виклики LLM, чергування з викликами інструментів або функцій та структуровані результати. Система оцінює результати, уточнює запити, за потреби викликає додаткові інструменти й продовжує цей цикл, доки не досягне задовільного рішення.

Вступ

У цьому уроці ви дізнаєтесь

Навчальні цілі

Після завершення цього уроку ви знатимете/зрозумієте:

Що таке Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) — це нова парадигма в AI, у якій великі мовні моделі (LLM) не лише витягують інформацію з зовнішніх джерел даних, а й автономно планують свої наступні кроки. На відміну від статичних шаблонів «витягни — прочитай» або ретельно прописаних послідовностей підказок, Agentic RAG передбачає цикл ітеративних викликів LLM, у який вплетені виклики інструментів або функцій та структуровані результати. На кожному етапі система оцінює отримані результати, вирішує, чи уточнювати запити, за потреби викликає додаткові інструменти і продовжує цей цикл, доки не досягне задовільного рішення.

Цей ітеративний стиль «maker-checker» покликаний підвищувати коректність, обробляти некоректні запити до структурованих баз даних (наприклад, NL2SQL) і забезпечувати збалансовані, високоякісні результати. Замість того щоб покладатися виключно на ретельно спроектовані ланцюги підказок, система активно володіє своїм процесом міркування. Вона може переписувати невдалі запити, обирати інші методи витягання інформації та інтегрувати кілька інструментів — таких як векторний пошук в Azure AI Search, SQL бази даних або кастомні API — перед тим як остаточно сформулювати відповідь. Це усуває потребу в надто складних фреймворках оркестрації. Замість цього відносно проста петля «LLM виклик → використання інструменту → LLM виклик → …» може продукувати витончені та добре обґрунтовані результати.

Agentic RAG Core Loop

Володіння процесом міркування

Відмінною рисою, що робить систему «агентною», є її здатність володіти процесом міркування. Традиційні реалізації RAG часто залежать від того, що люди заздалегідь визначають шлях для моделі: ланцюжок думок, який описує, що саме витягувати і коли. Але коли система справді агентна, вона внутрішньо вирішує, як підійти до задачі. Вона не просто виконує скрипт; вона автономно визначає послідовність кроків на основі якості знайденої інформації. Наприклад, якщо її просять створити стратегію запуску продукту, вона не покладається лише на підказку, яка детально описує увесь процес дослідження та прийняття рішень. Натомість агентна модель самостійно вирішує:

  1. Отримати поточні звіти про ринкові тенденції за допомогою Bing Web Grounding
  2. Ідентифікувати релевантні дані конкурентів за допомогою Azure AI Search.
  3. Корелювати історичні внутрішні метрики продажів за допомогою Azure SQL Database.
  4. Синтезувати висновки в цілісну стратегію, оркестровану через Azure OpenAI Service.
  5. Оцінити стратегію на наявність прогалин або несумісностей, при необхідності ініціювавши ще один раунд витягування даних. Всі ці кроки — уточнення запитів, вибір джерел, ітерації до «задоволення» відповіді — вирішуються моделлю, а не прописуються людиною.

Ітеративні цикли, інтеграція інструментів та пам’ять

Tool Integration Architecture

Агентна система спирається на петлевий патерн взаємодії:

З часом це створює відчуття еволюційного розуміння, дозволяючи моделі орієнтуватися в складних багатокрокових завданнях без потреби постійного втручання людини або переформування підказки.

Обробка режимів відмов та самовиправлення

Автономія Agentic RAG також передбачає надійні механізми самовиправлення. Коли система доходить до глухих кутів — наприклад, витягує нерелевантні документи або стикається з некоректними запитами — вона може:

Такий ітеративний і динамічний підхід дозволяє моделі постійно вдосконалюватися, гарантуючи, що вона не просто однократна система, а така, що вчиться на своїх помилках у рамках сесії.

Self Correction Mechanism

Межі агентності

Незважаючи на автономність у межах завдання, Agentic RAG не є аналогом Загального штучного інтелекту. Її «агентні» можливості обмежені інструментами, джерелами даних і політиками, наданими людьми-розробниками. Вона не може винаходити власні інструменти або виходити за межі встановлених доменів. Натомість вона відмінно координує доступні ресурси в динамічному порядку. Ключові відмінності від більш просунутих форм AI включають:

  1. Автономія у межах домену: Системи Agentic RAG зосереджені на досягненні цілей, визначених користувачем, у відомому домені, використовуючи стратегії на кшталт переписування запитів або вибору інструментів для покращення результатів.
  2. Залежність від інфраструктури: Можливості системи залежать від інструментів і даних, інтегрованих розробниками. Вона не може перевершити ці межі без втручання людини.
  3. Дотримання обмежень: Етичні настанови, правила відповідності та бізнес-політики залишаються надзвичайно важливими. Свобода агента завжди обмежена заходами безпеки та механізмами нагляду (сподіваємось).

Практичні випадки використання та цінність

Agentic RAG проявляє себе найкраще в сценаріях, що вимагають ітеративного уточнення і точності:

  1. Середовища з пріоритетом на коректність: У перевірках на відповідність, регуляторному аналізі або юридичних дослідженнях агентна модель може багаторазово підтверджувати факти, консультуватися з кількох джерел і переписувати запити, доки не отримає ретельно перевірену відповідь.
  2. Складні взаємодії з базами даних: Коли йдеться про структуровані дані, де запити часто можуть зазнати невдачі або потребувати коригування, система може автономно уточнювати свої запити, використовуючи Azure SQL або Microsoft Fabric OneLake, забезпечуючи, щоб фінальне витягнення відповідало наміру користувача.
  3. Тривалі робочі процеси: Сесії, що тривають довше, можуть еволюціонувати у міру появи нової інформації. Agentic RAG може постійно інтегрувати нові дані, змінюючи стратегії у міру того, як дізнається більше про предметну область.

Управління, прозорість та довіра

Оскільки ці системи стають більш автономними в міркуваннях, управління та прозорість набувають критичного значення:

Наявність інструментів, що забезпечують чіткий запис дій, є суттєвою. Без них налагодження багатокрокового процесу може бути дуже складним. Дивіться наступний приклад від Literal AI (компанія, що стоїть за Chainlit) для запуску агента:

Приклад запуску агента

Висновок

Agentic RAG уособлює природну еволюцію того, як AI-системи опрацьовують складні, насичені даними завдання. Приймаючи петльовий патерн взаємодії, автономно обираючи інструменти та уточнюючи запити до досягнення високоякісного результату, система переходить від статичного слідування підказкам до більш адаптивного, контекстно-усвідомленого прийняття рішень. Хоча вона все ще обмежена інфраструктурою та етичними настановами, ці агентні можливості забезпечують багатші, динамічніші й, зрештою, корисніші AI-взаємодії як для підприємств, так і для кінцевих користувачів.

Є ще питання про Agentic RAG?

Приєднуйтесь до Спільноти Microsoft Foundry у Discord, щоб зустріти інших учнів, відвідати години консультацій та отримати відповіді на свої питання щодо AI-агентів.

Додаткові ресурси

Академічні статті

Попередній урок

Патерн використання інструментів

Наступний урок

Побудова надійних агентів ШІ


Відмова від відповідальності: Цей документ було перекладено за допомогою сервісу перекладу на основі штучного інтелекту Co-op Translator. Хоча ми прагнемо до точності, просимо зауважити, що автоматичні переклади можуть містити помилки або неточності. Оригінальний документ мовою оригіналу слід вважати авторитетним джерелом. Для критично важливої інформації рекомендується звертатися до професійного перекладу, виконаного людиною. Ми не несемо відповідальності за будь-які непорозуміння чи неправильні тлумачення, що виникли внаслідок використання цього перекладу.