ai-agents-for-beginners

Agentic RAG

(Нажмите на изображение выше, чтобы посмотреть видео этого урока)

Agentic RAG

Этот урок предоставляет всесторонний обзор Agentic Retrieval-Augmented Generation (Agentic RAG) — новой парадигмы в области ИИ, где большие языковые модели (LLM) автономно планируют свои следующие шаги, одновременно извлекая информацию из внешних источников. В отличие от статичных схем «извлечение-потом-чтение», Agentic RAG включает итеративные вызовы LLM, прерываемые вызовами инструментов или функций и структурированными выводами. Система оценивает результаты, уточняет запросы, при необходимости вызывает дополнительные инструменты и продолжает этот цикл до достижения удовлетворительного решения.

Введение

Этот урок охватывает

Цели обучения

После завершения этого урока вы будете знать/понимать:

Что такое Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) — это новая парадигма в разработке ИИ, где большие языковые модели (LLM) не только извлекают информацию из внешних источников данных, но и автономно планируют свои следующие шаги. В отличие от статичных схем «извлечение-потом-чтение» или тщательно продуманных последовательностей подсказок, Agentic RAG включает цикл итеративных вызовов LLM, прерываемых вызовами инструментов или функций и структурированными выводами. На каждом шаге система оценивает полученные результаты, решает, нужно ли уточнить запросы, при необходимости вызывает дополнительные инструменты и продолжает этот цикл, пока не достигнет удовлетворительного решения.

Этот итеративный стиль работы «maker-checker» разработан для повышения корректности, обработки некорректно сформулированных запросов к структурированным базам данных (например, NL2SQL) и обеспечения сбалансированных, высококачественных результатов. Вместо того чтобы полагаться исключительно на тщательно продуманные цепочки подсказок, система активно владеет своим процессом рассуждений. Она может переписывать запросы, которые не сработали, выбирать другие методы извлечения и интегрировать несколько инструментов — таких как векторный поиск в Azure AI Search, SQL-базы данных или пользовательские API — прежде чем окончательно сформировать ответ. Это устраняет необходимость в чрезмерно сложных фреймворках оркестрации. Вместо этого относительно простой цикл «вызов LLM → использование инструмента → вызов LLM → …» может привести к сложным и хорошо обоснованным выводам.

Agentic RAG Core Loop

Владение процессом рассуждений

Отличительной чертой, делающей систему «агентной», является её способность владеть процессом рассуждений. Традиционные реализации RAG часто зависят от того, что люди заранее определяют путь для модели: цепочку размышлений, указывающую, что и когда извлекать. Но когда система по-настоящему агентная, она внутренне решает, как подойти к проблеме. Она не просто выполняет сценарий; она автономно определяет последовательность шагов на основе качества найденной информации. Например, если её просят создать стратегию запуска продукта, она не полагается исключительно на подсказку, которая описывает весь процесс исследования и принятия решений. Вместо этого агентная модель самостоятельно принимает решение:

  1. Получить отчёты о текущих рыночных тенденциях с помощью Bing Web Grounding
  2. Выявить релевантные данные о конкурентах с помощью Azure AI Search.
  3. Скоррелировать исторические внутренние метрики продаж с использованием Azure SQL Database.
  4. Синтезировать выводы в цельную стратегию, скоординированную через Azure OpenAI Service.
  5. Оценить стратегию на предмет пробелов или несоответствий, при необходимости инициировав ещё один раунд извлечения. Все эти шаги — уточнение запросов, выбор источников, итерация до «удовлетворения» ответом — принимаются моделью, а не заранее прописываются человеком.

Итеративные циклы, интеграция инструментов и память

Tool Integration Architecture

Агентная система опирается на циклический паттерн взаимодействия:

Со временем это создаёт ощущение эволюции понимания, позволяя модели справляться со сложными многоэтапными задачами без необходимости постоянного вмешательства человека или перестройки подсказки.

Обработка режимов отказа и самокоррекция

Автономность Agentic RAG также включает надёжные механизмы самокоррекции. Когда система сталкивается с тупиками — например, извлекает нерелевантные документы или встречает некорректно сформулированные запросы — она может:

Этот итеративный и динамичный подход позволяет модели постоянно совершенствоваться, гарантируя, что она не является одноразовой системой, а учится на своих ошибках в рамках текущей сессии.

Self Correction Mechanism

Границы агентности

Несмотря на автономию внутри задачи, Agentic RAG не является аналогом искусственного общего интеллекта. Её «агентные» возможности ограничены инструментами, источниками данных и политиками, предоставленными разработчиками-человеками. Она не может изобретать собственные инструменты или выходить за пределы установленных доменных границ. Вместо этого она эффективно оркестрирует доступные ресурсы. Ключевые отличия от более продвинутых форм ИИ включают:

  1. Доменно-специфическая автономия: Системы Agentic RAG ориентированы на достижение целей, определённых пользователем, в известной доменной области, применяя стратегии, такие как переписывание запросов или выбор инструментов для улучшения результатов.
  2. Зависимость от инфраструктуры: Возможности системы зависят от инструментов и данных, интегрированных разработчиками. Она не может превзойти эти границы без вмешательства человека.
  3. Соблюдение защитных мер: Этические руководящие принципы, правила соответствия и бизнес-политики остаются крайне важными. Свобода агента всегда ограничена мерами безопасности и механизмами надзора (надеюсь?)

Практические случаи и ценность

Agentic RAG особенно полезен в сценариях, требующих итеративного уточнения и точности:

  1. Окружения с приоритетом корректности: В проверках соответствия, регуляторном анализе или юридических исследованиях агентная модель может многократно проверять факты, консультироваться с несколькими источниками и переписывать запросы, пока не получит тщательно проверенный ответ.
  2. Сложные взаимодействия с базами данных: При работе со структурированными данными, где запросы часто могут падать или требовать корректировки, система может автономно уточнять свои запросы с использованием Azure SQL или Microsoft Fabric OneLake, обеспечивая соответствие конечного извлечения намерению пользователя.
  3. Длительные рабочие процессы: Долгие сессии могут развиваться по мере появления новой информации. Agentic RAG может непрерывно включать новые данные, меняя стратегии по мере того, как он узнаёт больше о предметной области.

Управление, прозрачность и доверие

По мере того как эти системы становятся более автономными в своих рассуждениях, управление и прозрачность имеют решающее значение:

Наличие инструментов, предоставляющих чёткий отчёт о действиях, имеет жизненно важное значение. Без них отладка многоэтапного процесса может быть очень сложной. См. следующий пример от Literal AI (компания за Chainlit) для запуска агента:

AgentRunExample

Заключение

Agentic RAG представляет собой естественную эволюцию того, как системы ИИ справляются со сложными задачами, требующими интенсивной работы с данными. Применяя циклический паттерн взаимодействия, автономно выбирая инструменты и уточняя запросы до получения высококачественного результата, система выходит за рамки статического следования подсказкам и становится более адаптивным, контекстно-осведомлённым принимающим решения. Хотя она по-прежнему ограничена инфраструктурой и этическими руководствами, заданными человеком, эти агентные возможности обеспечивают более насыщенные, динамичные и в конечном счёте более полезные взаимодействия с ИИ как для предприятий, так и для конечных пользователей.

Есть ещё вопросы об Agentic RAG?

Присоединяйтесь к Microsoft Foundry Discord, чтобы встретиться с другими учащимися, посетить часы консультаций и получить ответы на ваши вопросы по AI Agents.

Дополнительные ресурсы

Академические статьи

Предыдущий урок

Паттерн использования инструментов

Следующий урок

Построение надежных агентов ИИ


Отказ от ответственности: Этот документ был переведен с помощью сервиса машинного перевода Co-op Translator. Хотя мы стремимся к точности, имейте в виду, что автоматические переводы могут содержать ошибки или неточности. Оригинальный документ на его исходном языке следует считать авторитетным источником. Для критически важной информации рекомендуется профессиональный перевод, выполненный человеком. Мы не несем ответственности за какие-либо недопонимания или неправильные толкования, возникшие в результате использования этого перевода.