
(Натисніть на зображення вище, щоб переглянути відео цього уроку)
Агентний RAG
Цей урок надає всебічний огляд Агентного Відновлення-Розширеного Генерування (Agentic RAG), нового підходу в штучному інтелекті, де великі мовні моделі (LLMs) автономно планують свої наступні кроки, отримуючи інформацію з зовнішніх джерел. На відміну від статичних шаблонів “отримати-і-прочитати”, Agentic RAG передбачає ітеративні виклики до LLM, чергуючи їх із викликами інструментів або функцій та структурованими вихідними даними. Система оцінює результати, уточнює запити, викликає додаткові інструменти за потреби і продовжує цей цикл, доки не буде досягнуто задовільного рішення.
Вступ
Цей урок охоплює:
- Розуміння Agentic RAG: Дізнайтеся про новий підхід у штучному інтелекті, де великі мовні моделі (LLMs) автономно планують свої наступні кроки, отримуючи інформацію з зовнішніх джерел даних.
- Ітеративний стиль “Творець-Перевіряючий”: Зрозумійте цикл ітеративних викликів до LLM, чергуючи їх із викликами інструментів або функцій та структурованими вихідними даними, спрямованими на покращення точності та обробку некоректних запитів.
- Практичні застосування: Визначте сценарії, де Agentic RAG демонструє свої переваги, такі як середовища з пріоритетом точності, складні взаємодії з базами даних та розширені робочі процеси.
Цілі навчання
Після завершення цього уроку ви зможете:
- Розуміти Agentic RAG: Дізнатися про новий підхід у штучному інтелекті, де великі мовні моделі (LLMs) автономно планують свої наступні кроки, отримуючи інформацію з зовнішніх джерел даних.
- Ітеративний стиль “Творець-Перевіряючий”: Зрозуміти концепцію циклу ітеративних викликів до LLM, чергуючи їх із викликами інструментів або функцій та структурованими вихідними даними, спрямованими на покращення точності та обробку некоректних запитів.
- Володіння процесом мислення: Зрозуміти здатність системи самостійно приймати рішення щодо підходу до вирішення проблем без залежності від заздалегідь визначених шляхів.
- Робочий процес: Зрозуміти, як агентна модель самостійно вирішує отримати звіти про ринкові тенденції, визначити дані конкурентів, співвіднести внутрішні метрики продажів, синтезувати висновки та оцінити стратегію.
- Ітеративні цикли, інтеграція інструментів та пам’ять: Дізнатися про залежність системи від циклічного шаблону взаємодії, підтримуючи стан і пам’ять між кроками, щоб уникнути повторюваних циклів і приймати обґрунтовані рішення.
- Обробка режимів помилок та самокорекція: Дослідити надійні механізми самокорекції системи, включаючи ітерацію та повторний запит, використання діагностичних інструментів і звернення до людського нагляду.
- Межі агентності: Зрозуміти обмеження Agentic RAG, зосереджуючись на автономії в межах конкретної галузі, залежності від інфраструктури та дотриманні обмежень.
- Практичні випадки використання та цінність: Визначити сценарії, де Agentic RAG демонструє свої переваги, такі як середовища з пріоритетом точності, складні взаємодії з базами даних та розширені робочі процеси.
- Управління, прозорість та довіра: Дізнатися про важливість управління та прозорості, включаючи пояснювальне мислення, контроль упередженості та людський нагляд.
Що таке Agentic RAG?
Agentic Retrieval-Augmented Generation (Agentic RAG) — це новий підхід у штучному інтелекті, де великі мовні моделі (LLMs) автономно планують свої наступні кроки, отримуючи інформацію з зовнішніх джерел. На відміну від статичних шаблонів “отримати-і-прочитати”, Agentic RAG передбачає ітеративні виклики до LLM, чергуючи їх із викликами інструментів або функцій та структурованими вихідними даними. Система оцінює результати, уточнює запити, викликає додаткові інструменти за потреби і продовжує цей цикл, доки не буде досягнуто задовільного рішення. Цей ітеративний стиль “творець-перевіряючий” покращує точність, обробляє некоректні запити і забезпечує високоякісні результати.
Система активно володіє процесом мислення, переписуючи невдалі запити, вибираючи різні методи отримання даних і інтегруючи кілька інструментів — таких як пошук векторів у Azure AI Search, SQL-бази даних або власні API — перед тим, як завершити відповідь. Відмінною рисою агентної системи є її здатність володіти процесом мислення. Традиційні реалізації RAG покладаються на заздалегідь визначені шляхи, але агентна система автономно визначає послідовність кроків на основі якості знайденої інформації.
Визначення Agentic Retrieval-Augmented Generation (Agentic RAG)
Agentic Retrieval-Augmented Generation (Agentic RAG) — це новий підхід у розробці штучного інтелекту, де LLMs не лише отримують інформацію з зовнішніх джерел даних, але й автономно планують свої наступні кроки. На відміну від статичних шаблонів “отримати-і-прочитати” або ретельно прописаних послідовностей підказок, Agentic RAG передбачає цикл ітеративних викликів до LLM, чергуючи їх із викликами інструментів або функцій та структурованими вихідними даними. На кожному етапі система оцінює отримані результати, вирішує, чи потрібно уточнити запити, викликає додаткові інструменти за потреби і продовжує цей цикл, доки не досягне задовільного рішення.
Цей ітеративний стиль “творець-перевіряючий” спрямований на покращення точності, обробку некоректних запитів до структурованих баз даних (наприклад, NL2SQL) і забезпечення збалансованих, високоякісних результатів. Замість того, щоб покладатися виключно на ретельно спроектовані ланцюжки підказок, система активно володіє процесом мислення. Вона може переписувати невдалі запити, вибирати різні методи отримання даних і інтегрувати кілька інструментів — таких як пошук векторів у Azure AI Search, SQL-бази даних або власні API — перед тим, як завершити відповідь. Це усуває потребу в надмірно складних оркестраційних фреймворках. Натомість відносно простий цикл “виклик LLM → використання інструменту → виклик LLM → …” може забезпечити складні та добре обґрунтовані результати.

Володіння процесом мислення
Відмінною рисою, яка робить систему “агентною”, є її здатність володіти процесом мислення. Традиційні реалізації RAG часто залежать від того, що люди заздалегідь визначають шлях для моделі: ланцюжок думок, який визначає, що отримати і коли. Але коли система дійсно агентна, вона внутрішньо вирішує, як підійти до проблеми. Вона не просто виконує сценарій; вона автономно визначає послідовність кроків на основі якості знайденої інформації. Наприклад, якщо її просять створити стратегію запуску продукту, вона не покладається виключно на підказку, яка детально описує весь процес дослідження та прийняття рішень. Натомість агентна модель самостійно вирішує:
- Отримати звіти про поточні ринкові тенденції за допомогою Bing Web Grounding.
- Визначити відповідні дані конкурентів за допомогою Azure AI Search.
- Співвіднести історичні внутрішні метрики продажів за допомогою Azure SQL Database.
- Синтезувати висновки у цілісну стратегію, оркестровану через Azure OpenAI Service.
- Оцінити стратегію на наявність прогалин або невідповідностей, ініціюючи ще один раунд отримання даних за потреби.
Усі ці кроки — уточнення запитів, вибір джерел, ітерація до “задоволення” відповіддю — вирішуються моделлю, а не заздалегідь прописуються людиною.
Ітеративні цикли, інтеграція інструментів та пам’ять

Агентна система покладається на циклічний шаблон взаємодії:
- Початковий виклик: Ціль користувача (тобто підказка користувача) представляється LLM.
- Виклик інструменту: Якщо модель визначає відсутню інформацію або неоднозначні інструкції, вона вибирає інструмент або метод отримання даних — наприклад, запит до векторної бази даних (наприклад, Azure AI Search Hybrid search по приватних даних) або структурований SQL-запит — щоб отримати більше контексту.
- Оцінка та уточнення: Після перегляду отриманих даних модель вирішує, чи достатньо інформації. Якщо ні, вона уточнює запит, пробує інший інструмент або коригує свій підхід.
- Повторення до задоволення: Цей цикл продовжується, доки модель не визначить, що має достатньо ясності та доказів для надання остаточної, добре обґрунтованої відповіді.
- Пам’ять та стан: Оскільки система підтримує стан і пам’ять між кроками, вона може згадувати попередні спроби та їх результати, уникаючи повторюваних циклів і приймаючи більш обґрунтовані рішення в процесі.
З часом це створює відчуття еволюційного розуміння, дозволяючи моделі виконувати складні багатокрокові завдання без необхідності постійного втручання людини або коригування підказки.
Обробка режимів помилок та самокорекція
Автономність Agentic RAG також включає надійні механізми самокорекції. Коли система стикається з тупиковими ситуаціями — наприклад, отриманням нерелевантних документів або некоректними запитами — вона може:
- Ітерувати та повторно запитувати: Замість того, щоб повертати низькоцінні відповіді, модель пробує нові стратегії пошуку, переписує запити до баз даних або звертається до альтернативних наборів даних.
- Використовувати діагностичні інструменти: Система може викликати додаткові функції, призначені для допомоги у налагодженні її кроків мислення або підтвердження правильності отриманих даних. Інструменти, такі як Azure AI Tracing, будуть важливими для забезпечення надійної спостережуваності та моніторингу.
- Звертатися до людського нагляду: У сценаріях з високими ставками або повторними невдачами модель може позначати невизначеність і запитувати людське керівництво. Після того, як людина надасть коригувальний відгук, модель може врахувати цей урок у майбутньому.
Цей ітеративний і динамічний підхід дозволяє моделі постійно вдосконалюватися, забезпечуючи, що вона не просто одноразова система, а така, що вчиться на своїх помилках під час даної сесії.

Межі агентності
Незважаючи на автономність у межах завдання, Agentic RAG не є аналогом штучного загального інтелекту. Її “агентні” можливості обмежуються інструментами, джерелами даних та політиками, наданими розробниками. Вона не може винаходити власні інструменти або виходити за межі встановлених доменів. Натомість вона відмінно справляється з динамічною оркестрацією доступних ресурсів.
Основні відмінності від більш розвинених форм штучного інтелекту включають:
- Автономія в межах домену: Системи Agentic RAG зосереджені на досягненні цілей, визначених користувачем, у відомому домені, використовуючи стратегії, такі як переписування запитів або вибір інструментів, для покращення результатів.
- Залежність від інфраструктури: Можливості системи залежать від інструментів та даних, інтегрованих розробниками. Вона не може перевершити ці межі без втручання людини.
- Дотримання обмежень: Етичні принципи, правила відповідності та бізнес-політики залишаються дуже важливими. Свобода агента завжди обмежується заходами безпеки та механізмами нагляду (сподіваємося?).
Практичні випадки використання та цінність
Agentic RAG демонструє свої переваги у сценаріях, що потребують ітеративного уточнення та точності:
- Середовища з пріоритетом точності: У перевірці відповідності, регуляторному аналізі або юридичних дослідженнях агентна модель може повторно перевіряти факти, консультуватися з кількома джерелами та переписувати запити, доки не надасть ретельно перевірену відповідь.
- Складні взаємодії з базами даних: Під час роботи зі структурованими даними, де запити часто можуть зазнавати невдач або потребувати коригування, система може автономно уточнювати свої запити, використовуючи Azure SQL або Microsoft Fabric OneLake, забезпечуючи, що кінцеве отримання відповідає намірам користувача.
- Розширені робочі процеси: Довготривалі сесії можуть еволюціонувати, коли з’являється нова інформація. Agentic RAG може постійно інтегрувати нові дані, змінюючи стратегії, коли вона дізнається більше про простір проблеми.
Управління, прозорість та довіра
Оскільки ці системи стають більш автономними у своєму мисленні, управління та прозорість є вирішальними:
- Пояснювальне мислення: Модель може надати журнал запитів, які вона зробила, джерел, які вона консультувала, та кроків мислення, які вона виконала, щоб дійти до висновку. Інструменти, такі як Azure AI Content Safety та Azure AI Tracing / GenAIOps, можуть допомогти підтримувати прозорість та зменшувати ризики.
- Контроль упередженості та збалансоване отримання: Розробники можуть налаштовувати стратегії отримання, щоб забезпечити врахування збалансованих, репрезентативних джерел даних, та регулярно перевіряти результати, щоб виявити упередженість або перекоси, використовуючи власні моделі для розвинених організацій з аналізу даних за допомогою Azure Machine Learning.
- Людський нагляд та відповідність: Для чутлив
Реалізація Retrieval Augmented Generation (RAG) з Azure OpenAI Service: Дізнайтеся, як використовувати власні дані з Azure OpenAI Service. Цей модуль Microsoft Learn надає детальний посібник із впровадження RAG
- Оцінка застосунків генеративного штучного інтелекту з Azure AI Foundry: У цій статті розглядається оцінка та порівняння моделей на загальнодоступних наборах даних, включаючи застосунки Agentic AI та архітектури RAG
- Що таке Agentic RAG | Weaviate
- Agentic RAG: Повний посібник із агентно-орієнтованого Retrieval Augmented Generation – Новини про генерацію RAG
- Agentic RAG: прискорте свій RAG за допомогою переформулювання запитів і самозапитів! Hugging Face Open-Source AI Cookbook
- Додавання агентних шарів до RAG
- Майбутнє помічників знань: Джеррі Лю
- Як створювати системи Agentic RAG
- Використання Azure AI Foundry Agent Service для масштабування ваших AI-агентів
Академічні статті
Попередній урок
Шаблон використання інструментів
Наступний урок
Створення надійних AI-агентів
Відмова від відповідальності:
Цей документ був перекладений за допомогою сервісу автоматичного перекладу Co-op Translator. Хоча ми прагнемо до точності, будь ласка, майте на увазі, що автоматичні переклади можуть містити помилки або неточності. Оригінальний документ на його рідній мові слід вважати авторитетним джерелом. Для критичної інформації рекомендується професійний людський переклад. Ми не несемо відповідальності за будь-які непорозуміння або неправильні тлумачення, що виникають внаслідок використання цього перекладу.