ai-agents-for-beginners

Agentic RAG

(Нажмите на изображение выше, чтобы посмотреть видео этого урока)

Agentic RAG

Этот урок предоставляет подробный обзор Agentic Retrieval-Augmented Generation (Agentic RAG) — нового подхода в области искусственного интеллекта, где крупные языковые модели (LLMs) самостоятельно планируют свои действия, извлекая информацию из внешних источников. В отличие от статических схем «извлечение-обработка», Agentic RAG предполагает итеративные вызовы LLM, чередующиеся с использованием инструментов или функций и структурированными выводами. Система оценивает результаты, уточняет запросы, при необходимости вызывает дополнительные инструменты и продолжает этот цикл до достижения удовлетворительного решения.

Введение

В этом уроке вы узнаете:

Цели обучения

После завершения этого урока вы сможете:

Что такое Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) — это новый подход в области искусственного интеллекта, где крупные языковые модели (LLMs) самостоятельно планируют свои действия, извлекая информацию из внешних источников. В отличие от статических схем «извлечение-обработка», Agentic RAG предполагает итеративные вызовы LLM, чередующиеся с использованием инструментов или функций и структурированными выводами. Система оценивает результаты, уточняет запросы, при необходимости вызывает дополнительные инструменты и продолжает этот цикл до достижения удовлетворительного решения. Этот итеративный стиль «maker-checker» повышает точность, обрабатывает некорректные запросы и обеспечивает высокое качество результатов.

Система активно управляет процессом рассуждения, переписывает неудачные запросы, выбирает различные методы извлечения и интегрирует несколько инструментов — таких как векторный поиск в Azure AI Search, базы данных SQL или пользовательские API — перед финализацией ответа. Отличительная черта агентной системы — это способность самостоятельно управлять процессом рассуждения. Традиционные реализации RAG опираются на заранее определенные пути, но агентная система автономно определяет последовательность шагов на основе качества найденной информации.

Определение Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) — это новый подход в разработке ИИ, где LLMs не только извлекают информацию из внешних источников данных, но и самостоятельно планируют свои действия. В отличие от статических схем «извлечение-обработка» или тщательно прописанных последовательностей запросов, Agentic RAG предполагает цикл итеративных вызовов LLM, чередующихся с использованием инструментов или функций и структурированными выводами. На каждом этапе система оценивает полученные результаты, решает, нужно ли уточнить запросы, вызывает дополнительные инструменты при необходимости и продолжает этот цикл до достижения удовлетворительного решения.

Этот итеративный стиль «maker-checker» направлен на повышение точности, обработку некорректных запросов к структурированным базам данных (например, NL2SQL) и обеспечение сбалансированных, качественных результатов. Вместо того чтобы полагаться исключительно на тщательно разработанные цепочки запросов, система активно управляет процессом рассуждения. Она может переписывать неудачные запросы, выбирать различные методы извлечения и интегрировать несколько инструментов — таких как векторный поиск в Azure AI Search, базы данных SQL или пользовательские API — перед финализацией ответа. Это устраняет необходимость в чрезмерно сложных оркестрационных фреймворках. Вместо этого относительно простой цикл «вызов LLM → использование инструмента → вызов LLM → …» может привести к сложным и обоснованным выводам.

Agentic RAG Core Loop

Владение процессом рассуждения

Отличительная черта, которая делает систему «агентной», — это ее способность самостоятельно управлять процессом рассуждения. Традиционные реализации RAG часто зависят от заранее определенного человеком пути для модели: цепочки рассуждений, которая определяет, что извлекать и когда.
Но когда система действительно агентная, она сама решает, как подойти к задаче. Она не просто выполняет сценарий; она автономно определяет последовательность шагов на основе качества найденной информации.
Например, если ее просят создать стратегию запуска продукта, она не полагается исключительно на запрос, который полностью описывает весь процесс исследования и принятия решений. Вместо этого агентная модель самостоятельно решает:

  1. Извлечь текущие отчеты о рыночных тенденциях с помощью Bing Web Grounding.
  2. Определить соответствующие данные о конкурентах с помощью Azure AI Search.
  3. Сопоставить исторические внутренние метрики продаж с помощью Azure SQL Database.
  4. Синтезировать выводы в единую стратегию, организованную через Azure OpenAI Service.
  5. Оценить стратегию на наличие пробелов или несоответствий, инициируя еще один раунд извлечения при необходимости.

Все эти шаги — уточнение запросов, выбор источников, итерация до достижения «удовлетворительного» ответа — решаются моделью, а не заранее прописываются человеком.

Итеративные циклы, интеграция инструментов и память

Tool Integration Architecture

Агентная система опирается на циклический паттерн взаимодействия:

Со временем это создает ощущение развивающегося понимания, позволяя модели справляться с сложными многоэтапными задачами без необходимости постоянного вмешательства человека или изменения запроса.

Обработка режимов отказа и самокоррекция

Автономность Agentic RAG также включает надежные механизмы самокоррекции. Когда система сталкивается с тупиками — например, извлекает нерелевантные документы или сталкивается с некорректными запросами — она может:

Этот итеративный и динамичный подход позволяет модели постоянно улучшаться, гарантируя, что она не просто одноразовая система, а система, которая учится на своих ошибках в рамках текущей сессии.

Self Correction Mechanism

Границы агентности

Несмотря на свою автономность в рамках задачи, Agentic RAG не является аналогом искусственного общего интеллекта. Ее «агентные» возможности ограничиваются инструментами, источниками данных и политиками, предоставленными разработчиками. Она не может изобретать собственные инструменты или выходить за пределы установленных границ. Вместо этого она превосходно справляется с динамической оркестрацией доступных ресурсов.
Ключевые отличия от более продвинутых форм ИИ включают:

  1. Автономия в рамках конкретной области: Системы Agentic RAG сосредоточены на достижении целей, определенных пользователем, в известной области, используя стратегии, такие как переписывание запросов или выбор инструментов, для улучшения результатов.
  2. Зависимость от инфраструктуры: Возможности системы зависят от инструментов и данных, интегрированных разработчиками. Она не может превзойти эти границы без вмешательства человека.
  3. Соблюдение ограничений: Этические принципы, правила соответствия и бизнес-политики остаются очень важными. Свобода агента всегда ограничивается мерами безопасности и механизмами контроля (надеемся?).

Практические случаи использования и ценность

Agentic RAG особенно эффективен в сценариях, требующих итеративного уточнения и точности:

  1. Среды с приоритетом на точность: В проверке соответствия, анализе нормативных актов или юридических исследованиях агентная модель может многократно проверять факты, консультироваться с несколькими источниками и переписывать запросы до тех пор, пока не будет получен тщательно проверенный ответ.
  2. Сложные взаимодействия с базами данных: При работе со структурированными данными, где запросы часто могут терпеть неудачу или требовать корректировки, система может самостоятельно уточнять запросы, используя Azure SQL или Microsoft Fabric OneLake, гарантируя, что окончательное извлечение соответствует намерениям пользователя.
  3. Расширенные рабочие процессы: Длительные сессии могут развиваться по мере появления новой информации. Agentic RAG может постоянно интегрировать новые данные, изменяя стратегии по мере того, как она узнает больше о проблемной области.

Управление, прозрачность и доверие

По мере того как эти системы становятся более автономными в своих рассуждениях, управление и прозрачность становятся критически важными:

Наличие инструментов, которые предоставляют четкий отчет о действиях, является важным. Без них отладка многоэтапного процесса может быть очень сложной. См. следующий пример от Literal AI (компания, стоящая за Chainlit) для выполнения агентом:

AgentRunExample

Заключение

Agentic RAG представляет собой естественную эволюцию в том, как системы ИИ справляются со сложными задачами, требующими интенсивной работы с данными. Применяя циклический паттерн взаимодействия, автономно выбирая инструменты и уточняя запросы до достижения качественного результата, система выходит за рамки статического следования запросам, становясь более адаптивной и осведомленной в контексте принятия решений. Хотя она все еще ограничена инфраструктурой и этическими принципами, определенными человеком, эти агентные возможности позволяют создавать более богатые, динамичные и, в конечном итоге, более полезные взаимодействия с ИИ как для предприятий, так и для конечных пользователей.

Остались вопросы о Agentic RAG?

Присоединяйтесь к Azure AI Foundry Discord, чтобы встретиться с другими учащимися, посетить часы консультаций и получить ответы на свои вопросы о AI Agents.

Дополнительные ресурсы

Научные статьи

Предыдущий урок

Шаблон проектирования использования инструментов

Следующий урок

Создание надежных AI-агентов


Отказ от ответственности:
Этот документ был переведен с помощью сервиса автоматического перевода Co-op Translator. Несмотря на наши усилия обеспечить точность перевода, автоматические переводы могут содержать ошибки или неточности. Оригинальный документ на его родном языке следует считать авторитетным источником. Для получения критически важной информации рекомендуется профессиональный перевод человеком. Мы не несем ответственности за любые недоразумения или неправильные интерпретации, возникшие в результате использования данного перевода.