
(Нажмите на изображение выше, чтобы посмотреть видео этого урока)
Agentic RAG
Этот урок предоставляет всесторонний обзор Agentic Retrieval-Augmented Generation (Agentic RAG) — новой парадигмы в области ИИ, где большие языковые модели (LLM) автономно планируют свои следующие шаги, одновременно извлекая информацию из внешних источников. В отличие от статичных схем «извлечение-потом-чтение», Agentic RAG включает итеративные вызовы LLM, прерываемые вызовами инструментов или функций и структурированными выводами. Система оценивает результаты, уточняет запросы, при необходимости вызывает дополнительные инструменты и продолжает этот цикл до достижения удовлетворительного решения.
Введение
Этот урок охватывает
- Понимание Agentic RAG: Узнайте о новой парадигме в ИИ, где большие языковые модели (LLM) автономно планируют свои следующие шаги, одновременно извлекая информацию из внешних источников данных.
- Освоение итеративного стиля «Maker-Checker»: Поймите цикл итеративных вызовов LLM, прерываемых вызовами инструментов или функций и структурированными выводами, направленный на повышение корректности и обработку некорректно сформулированных запросов.
- Изучение практических применений: Определите сценарии, в которых Agentic RAG демонстрирует свои преимущества, такие как среды с приоритетом корректности, сложные взаимодействия с базами данных и длительные рабочие процессы.
Цели обучения
После завершения этого урока вы будете знать/понимать:
- Понимание Agentic RAG: Узнайте о новой парадигме в ИИ, где большие языковые модели (LLM) автономно планируют свои следующие шаги, одновременно извлекая информацию из внешних источников данных.
- Итеративный стиль Maker-Checker: Освойте концепцию цикла итеративных вызовов LLM, прерываемых вызовами инструментов или функций и структурированными выводами, направленного на повышение корректности и обработку некорректно сформулированных запросов.
- Контроль процесса рассуждений: Поймите способность системы владеть своим процессом рассуждений, принимая решения о подходе к задачам без опоры на заранее определённые пути.
- Рабочий процесс: Поймите, как агентная модель самостоятельно принимает решение извлечь отчёты о рыночных тенденциях, выявить данные о конкурентах, скоррелировать внутренние показатели продаж, синтезировать выводы и оценить стратегию.
- Итеративные циклы, интеграция инструментов и память: Узнайте о зависимости системы от циклического паттерна взаимодействия, поддерживающего состояние и память между шагами, чтобы избежать повторяющихся петель и принимать обоснованные решения.
- Обработка ошибок и самокоррекция: Изучите надёжные механизмы самокоррекции системы, включая итерации и повторные запросы, использование диагностических инструментов и обращение к человеческому контролю.
- Границы агентности: Поймите ограничения Agentic RAG, сосредоточенные на доменно-специфической автономии, зависимости от инфраструктуры и соблюдении защитных мер.
- Практические случаи и ценность: Определите сценарии, в которых Agentic RAG особенно полезен — например, среды с приоритетом корректности, сложные взаимодействия с базами данных и длительные рабочие процессы.
- Управление, прозрачность и доверие: Узнайте о важности управления и прозрачности, включая объяснимые рассуждения, контроль смещения и человеческий надзор.
Что такое Agentic RAG?
Agentic Retrieval-Augmented Generation (Agentic RAG) — это новая парадигма в разработке ИИ, где большие языковые модели (LLM) не только извлекают информацию из внешних источников данных, но и автономно планируют свои следующие шаги. В отличие от статичных схем «извлечение-потом-чтение» или тщательно продуманных последовательностей подсказок, Agentic RAG включает цикл итеративных вызовов LLM, прерываемых вызовами инструментов или функций и структурированными выводами. На каждом шаге система оценивает полученные результаты, решает, нужно ли уточнить запросы, при необходимости вызывает дополнительные инструменты и продолжает этот цикл, пока не достигнет удовлетворительного решения.
Этот итеративный стиль работы «maker-checker» разработан для повышения корректности, обработки некорректно сформулированных запросов к структурированным базам данных (например, NL2SQL) и обеспечения сбалансированных, высококачественных результатов. Вместо того чтобы полагаться исключительно на тщательно продуманные цепочки подсказок, система активно владеет своим процессом рассуждений. Она может переписывать запросы, которые не сработали, выбирать другие методы извлечения и интегрировать несколько инструментов — таких как векторный поиск в Azure AI Search, SQL-базы данных или пользовательские API — прежде чем окончательно сформировать ответ. Это устраняет необходимость в чрезмерно сложных фреймворках оркестрации. Вместо этого относительно простой цикл «вызов LLM → использование инструмента → вызов LLM → …» может привести к сложным и хорошо обоснованным выводам.

Владение процессом рассуждений
Отличительной чертой, делающей систему «агентной», является её способность владеть процессом рассуждений. Традиционные реализации RAG часто зависят от того, что люди заранее определяют путь для модели: цепочку размышлений, указывающую, что и когда извлекать.
Но когда система по-настоящему агентная, она внутренне решает, как подойти к проблеме. Она не просто выполняет сценарий; она автономно определяет последовательность шагов на основе качества найденной информации.
Например, если её просят создать стратегию запуска продукта, она не полагается исключительно на подсказку, которая описывает весь процесс исследования и принятия решений. Вместо этого агентная модель самостоятельно принимает решение:
- Получить отчёты о текущих рыночных тенденциях с помощью Bing Web Grounding
- Выявить релевантные данные о конкурентах с помощью Azure AI Search.
- Скоррелировать исторические внутренние метрики продаж с использованием Azure SQL Database.
- Синтезировать выводы в цельную стратегию, скоординированную через Azure OpenAI Service.
- Оценить стратегию на предмет пробелов или несоответствий, при необходимости инициировав ещё один раунд извлечения.
Все эти шаги — уточнение запросов, выбор источников, итерация до «удовлетворения» ответом — принимаются моделью, а не заранее прописываются человеком.
Итеративные циклы, интеграция инструментов и память

Агентная система опирается на циклический паттерн взаимодействия:
- Первоначальный вызов: Цель пользователя (т.е. запрос пользователя) представляется LLM.
- Вызов инструмента: Если модель обнаруживает отсутствующую информацию или неоднозначные инструкции, она выбирает инструмент или метод извлечения — например, запрос к векторной базе данных (например, гибридный поиск Azure AI Search по приватным данным) или структурированный SQL-вызов — чтобы собрать больше контекста.
- Оценка и уточнение: После изучения возвращённых данных модель решает, достаточна ли информация. Если нет, она уточняет запрос, пробует другой инструмент или изменяет подход.
- Повторять до удовлетворения: Этот цикл продолжается до тех пор, пока модель не определит, что у неё достаточно ясности и доказательств для предоставления окончательного, хорошо обоснованного ответа.
- Память и состояние: Поскольку система сохраняет состояние и память между шагами, она может вспоминать предыдущие попытки и их результаты, избегая повторяющихся циклов и принимая более информированные решения по мере продвижения.
Со временем это создаёт ощущение эволюции понимания, позволяя модели справляться со сложными многоэтапными задачами без необходимости постоянного вмешательства человека или перестройки подсказки.
Обработка режимов отказа и самокоррекция
Автономность Agentic RAG также включает надёжные механизмы самокоррекции. Когда система сталкивается с тупиками — например, извлекает нерелевантные документы или встречает некорректно сформулированные запросы — она может:
- Итерировать и повторно запрашивать: Вместо возврата малоценного ответа модель пытается новые стратегии поиска, переписывает запросы к базе данных или обращается к альтернативным наборам данных.
- Использовать диагностические инструменты: Система может вызвать дополнительные функции, предназначенные для отладки её шагов рассуждений или подтверждения корректности извлечённых данных. Инструменты, такие как Azure AI Tracing, будут важны для обеспечения надёжной наблюдаемости и мониторинга.
- Обратиться к человеческому надзору: Для задач с высоким риском или при повторных неудачах модель может пометить неопределённость и запросить руководство человека. После того как человек предоставит корректирующую обратную связь, модель может учесть этот урок в дальнейшем.
Этот итеративный и динамичный подход позволяет модели постоянно совершенствоваться, гарантируя, что она не является одноразовой системой, а учится на своих ошибках в рамках текущей сессии.

Границы агентности
Несмотря на автономию внутри задачи, Agentic RAG не является аналогом искусственного общего интеллекта. Её «агентные» возможности ограничены инструментами, источниками данных и политиками, предоставленными разработчиками-человеками. Она не может изобретать собственные инструменты или выходить за пределы установленных доменных границ. Вместо этого она эффективно оркестрирует доступные ресурсы.
Ключевые отличия от более продвинутых форм ИИ включают:
- Доменно-специфическая автономия: Системы Agentic RAG ориентированы на достижение целей, определённых пользователем, в известной доменной области, применяя стратегии, такие как переписывание запросов или выбор инструментов для улучшения результатов.
- Зависимость от инфраструктуры: Возможности системы зависят от инструментов и данных, интегрированных разработчиками. Она не может превзойти эти границы без вмешательства человека.
- Соблюдение защитных мер: Этические руководящие принципы, правила соответствия и бизнес-политики остаются крайне важными. Свобода агента всегда ограничена мерами безопасности и механизмами надзора (надеюсь?)
Практические случаи и ценность
Agentic RAG особенно полезен в сценариях, требующих итеративного уточнения и точности:
- Окружения с приоритетом корректности: В проверках соответствия, регуляторном анализе или юридических исследованиях агентная модель может многократно проверять факты, консультироваться с несколькими источниками и переписывать запросы, пока не получит тщательно проверенный ответ.
- Сложные взаимодействия с базами данных: При работе со структурированными данными, где запросы часто могут падать или требовать корректировки, система может автономно уточнять свои запросы с использованием Azure SQL или Microsoft Fabric OneLake, обеспечивая соответствие конечного извлечения намерению пользователя.
- Длительные рабочие процессы: Долгие сессии могут развиваться по мере появления новой информации. Agentic RAG может непрерывно включать новые данные, меняя стратегии по мере того, как он узнаёт больше о предметной области.
Управление, прозрачность и доверие
По мере того как эти системы становятся более автономными в своих рассуждениях, управление и прозрачность имеют решающее значение:
- Объяснимые рассуждения: Модель может предоставить аудит-трейл запросов, которые она сделала, источников, к которым обращалась, и шагов рассуждений, которые она предприняла для достижения вывода. Инструменты, такие как Azure AI Content Safety и Azure AI Tracing / GenAIOps, могут помочь поддерживать прозрачность и снижать риски.
- Контроль смещения и сбалансированное извлечение: Разработчики могут настраивать стратегии извлечения, чтобы обеспечить учёт сбалансированных и репрезентативных источников данных, а также регулярно проверять выходы на предмет смещения или искажённых паттернов с помощью пользовательских моделей для продвинутых аналитических команд, использующих Azure Machine Learning.
- Человеческий надзор и соответствие: Для чувствительных задач человеческая проверка остаётся необходимой. Agentic RAG не заменяет человеческое суждение в задачах с высоким риском — он дополняет его, предоставляя более тщательно проверенные варианты.
Наличие инструментов, предоставляющих чёткий отчёт о действиях, имеет жизненно важное значение. Без них отладка многоэтапного процесса может быть очень сложной. См. следующий пример от Literal AI (компания за Chainlit) для запуска агента:

Заключение
Agentic RAG представляет собой естественную эволюцию того, как системы ИИ справляются со сложными задачами, требующими интенсивной работы с данными. Применяя циклический паттерн взаимодействия, автономно выбирая инструменты и уточняя запросы до получения высококачественного результата, система выходит за рамки статического следования подсказкам и становится более адаптивным, контекстно-осведомлённым принимающим решения. Хотя она по-прежнему ограничена инфраструктурой и этическими руководствами, заданными человеком, эти агентные возможности обеспечивают более насыщенные, динамичные и в конечном счёте более полезные взаимодействия с ИИ как для предприятий, так и для конечных пользователей.
Есть ещё вопросы об Agentic RAG?
Присоединяйтесь к Microsoft Foundry Discord, чтобы встретиться с другими учащимися, посетить часы консультаций и получить ответы на ваши вопросы по AI Agents.
Дополнительные ресурсы
Академические статьи
Предыдущий урок
Паттерн использования инструментов
Следующий урок
Построение надежных агентов ИИ
Отказ от ответственности:
Этот документ был переведен с помощью сервиса машинного перевода Co-op Translator. Хотя мы стремимся к точности, имейте в виду, что автоматические переводы могут содержать ошибки или неточности. Оригинальный документ на его исходном языке следует считать авторитетным источником. Для критически важной информации рекомендуется профессиональный перевод, выполненный человеком. Мы не несем ответственности за какие-либо недопонимания или неправильные толкования, возникшие в результате использования этого перевода.