ai-agents-for-beginners

Agentic RAG

(Натисніть на зображення вище, щоб переглянути відео цього уроку)

Агентний RAG

Цей урок надає всебічний огляд Агентного Відновлення-Розширеного Генерування (Agentic RAG), нового підходу в штучному інтелекті, де великі мовні моделі (LLMs) автономно планують свої наступні кроки, отримуючи інформацію з зовнішніх джерел. На відміну від статичних шаблонів “отримати-і-прочитати”, Agentic RAG передбачає ітеративні виклики до LLM, чергуючи їх із викликами інструментів або функцій та структурованими вихідними даними. Система оцінює результати, уточнює запити, викликає додаткові інструменти за потреби і продовжує цей цикл, доки не буде досягнуто задовільного рішення.

Вступ

Цей урок охоплює:

Цілі навчання

Після завершення цього уроку ви зможете:

Що таке Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) — це новий підхід у штучному інтелекті, де великі мовні моделі (LLMs) автономно планують свої наступні кроки, отримуючи інформацію з зовнішніх джерел. На відміну від статичних шаблонів “отримати-і-прочитати”, Agentic RAG передбачає ітеративні виклики до LLM, чергуючи їх із викликами інструментів або функцій та структурованими вихідними даними. Система оцінює результати, уточнює запити, викликає додаткові інструменти за потреби і продовжує цей цикл, доки не буде досягнуто задовільного рішення. Цей ітеративний стиль “творець-перевіряючий” покращує точність, обробляє некоректні запити і забезпечує високоякісні результати.

Система активно володіє процесом мислення, переписуючи невдалі запити, вибираючи різні методи отримання даних і інтегруючи кілька інструментів — таких як пошук векторів у Azure AI Search, SQL-бази даних або власні API — перед тим, як завершити відповідь. Відмінною рисою агентної системи є її здатність володіти процесом мислення. Традиційні реалізації RAG покладаються на заздалегідь визначені шляхи, але агентна система автономно визначає послідовність кроків на основі якості знайденої інформації.

Визначення Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) — це новий підхід у розробці штучного інтелекту, де LLMs не лише отримують інформацію з зовнішніх джерел даних, але й автономно планують свої наступні кроки. На відміну від статичних шаблонів “отримати-і-прочитати” або ретельно прописаних послідовностей підказок, Agentic RAG передбачає цикл ітеративних викликів до LLM, чергуючи їх із викликами інструментів або функцій та структурованими вихідними даними. На кожному етапі система оцінює отримані результати, вирішує, чи потрібно уточнити запити, викликає додаткові інструменти за потреби і продовжує цей цикл, доки не досягне задовільного рішення.

Цей ітеративний стиль “творець-перевіряючий” спрямований на покращення точності, обробку некоректних запитів до структурованих баз даних (наприклад, NL2SQL) і забезпечення збалансованих, високоякісних результатів. Замість того, щоб покладатися виключно на ретельно спроектовані ланцюжки підказок, система активно володіє процесом мислення. Вона може переписувати невдалі запити, вибирати різні методи отримання даних і інтегрувати кілька інструментів — таких як пошук векторів у Azure AI Search, SQL-бази даних або власні API — перед тим, як завершити відповідь. Це усуває потребу в надмірно складних оркестраційних фреймворках. Натомість відносно простий цикл “виклик LLM → використання інструменту → виклик LLM → …” може забезпечити складні та добре обґрунтовані результати.

Agentic RAG Core Loop

Володіння процесом мислення

Відмінною рисою, яка робить систему “агентною”, є її здатність володіти процесом мислення. Традиційні реалізації RAG часто залежать від того, що люди заздалегідь визначають шлях для моделі: ланцюжок думок, який визначає, що отримати і коли. Але коли система дійсно агентна, вона внутрішньо вирішує, як підійти до проблеми. Вона не просто виконує сценарій; вона автономно визначає послідовність кроків на основі якості знайденої інформації. Наприклад, якщо її просять створити стратегію запуску продукту, вона не покладається виключно на підказку, яка детально описує весь процес дослідження та прийняття рішень. Натомість агентна модель самостійно вирішує:

  1. Отримати звіти про поточні ринкові тенденції за допомогою Bing Web Grounding.
  2. Визначити відповідні дані конкурентів за допомогою Azure AI Search.
  3. Співвіднести історичні внутрішні метрики продажів за допомогою Azure SQL Database.
  4. Синтезувати висновки у цілісну стратегію, оркестровану через Azure OpenAI Service.
  5. Оцінити стратегію на наявність прогалин або невідповідностей, ініціюючи ще один раунд отримання даних за потреби.

Усі ці кроки — уточнення запитів, вибір джерел, ітерація до “задоволення” відповіддю — вирішуються моделлю, а не заздалегідь прописуються людиною.

Ітеративні цикли, інтеграція інструментів та пам’ять

Tool Integration Architecture

Агентна система покладається на циклічний шаблон взаємодії:

З часом це створює відчуття еволюційного розуміння, дозволяючи моделі виконувати складні багатокрокові завдання без необхідності постійного втручання людини або коригування підказки.

Обробка режимів помилок та самокорекція

Автономність Agentic RAG також включає надійні механізми самокорекції. Коли система стикається з тупиковими ситуаціями — наприклад, отриманням нерелевантних документів або некоректними запитами — вона може:

Цей ітеративний і динамічний підхід дозволяє моделі постійно вдосконалюватися, забезпечуючи, що вона не просто одноразова система, а така, що вчиться на своїх помилках під час даної сесії.

Self Correction Mechanism

Межі агентності

Незважаючи на автономність у межах завдання, Agentic RAG не є аналогом штучного загального інтелекту. Її “агентні” можливості обмежуються інструментами, джерелами даних та політиками, наданими розробниками. Вона не може винаходити власні інструменти або виходити за межі встановлених доменів. Натомість вона відмінно справляється з динамічною оркестрацією доступних ресурсів.

Основні відмінності від більш розвинених форм штучного інтелекту включають:

  1. Автономія в межах домену: Системи Agentic RAG зосереджені на досягненні цілей, визначених користувачем, у відомому домені, використовуючи стратегії, такі як переписування запитів або вибір інструментів, для покращення результатів.
  2. Залежність від інфраструктури: Можливості системи залежать від інструментів та даних, інтегрованих розробниками. Вона не може перевершити ці межі без втручання людини.
  3. Дотримання обмежень: Етичні принципи, правила відповідності та бізнес-політики залишаються дуже важливими. Свобода агента завжди обмежується заходами безпеки та механізмами нагляду (сподіваємося?).

Практичні випадки використання та цінність

Agentic RAG демонструє свої переваги у сценаріях, що потребують ітеративного уточнення та точності:

  1. Середовища з пріоритетом точності: У перевірці відповідності, регуляторному аналізі або юридичних дослідженнях агентна модель може повторно перевіряти факти, консультуватися з кількома джерелами та переписувати запити, доки не надасть ретельно перевірену відповідь.
  2. Складні взаємодії з базами даних: Під час роботи зі структурованими даними, де запити часто можуть зазнавати невдач або потребувати коригування, система може автономно уточнювати свої запити, використовуючи Azure SQL або Microsoft Fabric OneLake, забезпечуючи, що кінцеве отримання відповідає намірам користувача.
  3. Розширені робочі процеси: Довготривалі сесії можуть еволюціонувати, коли з’являється нова інформація. Agentic RAG може постійно інтегрувати нові дані, змінюючи стратегії, коли вона дізнається більше про простір проблеми.

Управління, прозорість та довіра

Оскільки ці системи стають більш автономними у своєму мисленні, управління та прозорість є вирішальними:

Академічні статті

Попередній урок

Шаблон використання інструментів

Наступний урок

Створення надійних AI-агентів


Відмова від відповідальності:
Цей документ був перекладений за допомогою сервісу автоматичного перекладу Co-op Translator. Хоча ми прагнемо до точності, будь ласка, майте на увазі, що автоматичні переклади можуть містити помилки або неточності. Оригінальний документ на його рідній мові слід вважати авторитетним джерелом. Для критичної інформації рекомендується професійний людський переклад. Ми не несемо відповідальності за будь-які непорозуміння або неправильні тлумачення, що виникають внаслідок використання цього перекладу.