ai-agents-for-beginners

Agentic RAG

(Нажмите на изображение выше, чтобы посмотреть видео этого урока)

Agentic RAG

Этот урок предоставляет всесторонний обзор Agentic Retrieval-Augmented Generation (Agentic RAG) — нового подхода в области искусственного интеллекта, где крупные языковые модели (LLMs) автономно планируют свои дальнейшие шаги, извлекая информацию из внешних источников. В отличие от статических моделей «извлечь, затем прочитать», Agentic RAG включает итеративные вызовы LLM, чередующиеся с использованием инструментов или функций и структурированных выводов. Система оценивает результаты, уточняет запросы, при необходимости вызывает дополнительные инструменты и продолжает этот цикл до достижения удовлетворительного решения.

Введение

В этом уроке вы узнаете:

Цели обучения

После завершения этого урока вы будете знать/понимать:

Что такое Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) — это новый подход в области искусственного интеллекта, где крупные языковые модели (LLMs) автономно планируют свои дальнейшие шаги, извлекая информацию из внешних источников. В отличие от статических моделей «извлечь, затем прочитать», Agentic RAG включает итеративные вызовы LLM, чередующиеся с использованием инструментов или функций и структурированных выводов. Система оценивает результаты, уточняет запросы, при необходимости вызывает дополнительные инструменты и продолжает этот цикл до достижения удовлетворительного решения. Этот итеративный стиль «maker-checker» повышает точность, обрабатывает некорректные запросы и обеспечивает высокое качество результатов.

Система активно управляет процессом рассуждений, переписывает неудачные запросы, выбирает различные методы извлечения и интегрирует несколько инструментов — таких как векторный поиск в Azure AI Search, SQL-базы данных или пользовательские API — перед финализацией ответа. Отличительная черта агентной системы — способность самостоятельно управлять процессом рассуждений. Традиционные реализации RAG полагаются на заранее определенные пути, но агентная система автономно определяет последовательность шагов на основе качества найденной информации.

Определение Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) — это новый подход в разработке искусственного интеллекта, где LLMs не только извлекают информацию из внешних источников данных, но и автономно планируют свои дальнейшие шаги. В отличие от статических моделей «извлечь, затем прочитать» или тщательно прописанных последовательностей подсказок, Agentic RAG включает цикл итеративных вызовов LLM, чередующихся с использованием инструментов или функций и структурированных выводов. На каждом этапе система оценивает полученные результаты, решает, нужно ли уточнить запросы, вызывает дополнительные инструменты при необходимости и продолжает этот цикл до достижения удовлетворительного решения.

Этот итеративный стиль «maker-checker» разработан для повышения точности, обработки некорректных запросов к структурированным базам данных (например, NL2SQL) и обеспечения сбалансированных, высококачественных результатов. Вместо того чтобы полагаться исключительно на тщательно разработанные цепочки подсказок, система активно управляет процессом рассуждений. Она может переписывать неудачные запросы, выбирать различные методы извлечения и интегрировать несколько инструментов — таких как векторный поиск в Azure AI Search, SQL-базы данных или пользовательские API — перед финализацией ответа. Это устраняет необходимость в чрезмерно сложных оркестрационных фреймворках. Вместо этого относительно простой цикл «вызов LLM → использование инструмента → вызов LLM → …» может привести к сложным и обоснованным выводам.

Agentic RAG Core Loop

Владение процессом рассуждений

Отличительная черта, которая делает систему «агентной», — это ее способность самостоятельно управлять процессом рассуждений. Традиционные реализации RAG часто зависят от заранее определенного человеком пути для модели: цепочки рассуждений, которая определяет, что извлекать и когда. Но когда система действительно агентная, она самостоятельно решает, как подходить к задаче. Она не просто выполняет сценарий; она автономно определяет последовательность шагов на основе качества найденной информации.

Например, если ее просят создать стратегию запуска продукта, она не полагается исключительно на подсказку, которая полностью описывает весь процесс исследования и принятия решений. Вместо этого агентная модель самостоятельно решает:

  1. Извлечь текущие отчеты о рыночных тенденциях с помощью Bing Web Grounding.
  2. Определить соответствующие данные о конкурентах с помощью Azure AI Search.
  3. Сопоставить исторические внутренние метрики продаж с помощью Azure SQL Database.
  4. Синтезировать выводы в согласованную стратегию, организованную через Azure OpenAI Service.
  5. Оценить стратегию на наличие пробелов или несоответствий, инициируя еще один цикл извлечения при необходимости.

Все эти шаги — уточнение запросов, выбор источников, итерация до достижения «удовлетворительного» ответа — решаются моделью, а не заранее прописываются человеком.

Итеративные циклы, интеграция инструментов и память

Tool Integration Architecture

Агентная система опирается на циклический паттерн взаимодействия:

Со временем это создает ощущение развивающегося понимания, позволяя модели выполнять сложные, многоэтапные задачи без необходимости постоянного вмешательства человека или изменения запроса.

Обработка режимов отказа и самокоррекция

Автономия Agentic RAG также включает надежные механизмы самокоррекции. Когда система сталкивается с тупиками — например, извлекает нерелевантные документы или сталкивается с некорректными запросами — она может:

Этот итеративный и динамичный подход позволяет модели постоянно улучшаться, гарантируя, что она не просто одноразовая система, а система, которая учится на своих ошибках в рамках текущей сессии.

Self Correction Mechanism

Границы агентности

Несмотря на свою автономию в рамках задачи, Agentic RAG не является аналогом искусственного общего интеллекта. Ее «агентные» возможности ограничены инструментами, источниками данных и политиками, предоставленными разработчиками. Она не может изобретать собственные инструменты или выходить за пределы установленных границ. Вместо этого она превосходно справляется с динамической оркестрацией доступных ресурсов.

Ключевые отличия от более продвинутых форм ИИ включают:

  1. Автономия в рамках домена: Системы Agentic RAG сосредоточены на достижении целей, определенных пользователем, в известной области, используя стратегии, такие как переписывание запросов или выбор инструментов, для улучшения результатов.
  2. Зависимость от инфраструктуры: Возможности системы зависят от инструментов и данных, интегрированных разработчиками. Она не может превзойти эти границы без вмешательства человека.
  3. Соблюдение ограничений: Этические принципы, правила соответствия и бизнес-политики остаются очень важными. Свобода агента всегда ограничена мерами безопасности и механизмами контроля (надеемся?).

Практические случаи использования и ценность

Agentic RAG особенно полезен в сценариях, требующих итеративного уточнения и точности:

  1. Среды с приоритетом точности: В проверке соответствия, анализе нормативных актов или юридических исследованиях агентная модель может многократно проверять факты, консультироваться с несколькими источниками и переписывать запросы до тех пор, пока не предоставит тщательно проверенный ответ.
  2. Сложные взаимодействия с базами данных: При работе со структурированными данными, где запросы часто могут терпеть неудачу или требовать корректировки, система может автономно уточнять запросы, используя Azure SQL или Microsoft Fabric OneLake, гарантируя, что окончательное извлечение соответствует намерениям пользователя.
  3. Расширенные рабочие процессы: Длительные сессии могут развиваться по мере появления новой информации. Agentic RAG может постоянно включать новые данные, изменяя стратегии по мере того, как она узнает больше о проблемной области.

Управление, прозрачность и доверие

По мере того как эти системы становятся более автономными в своих рассуждениях, управление и прозрачность становятся критически важными:

Наличие инструментов, которые предоставляют четкий отчет о действиях, является важным. Без них отладка многоэтапного процесса может быть очень сложной. См. следующий пример от Literal AI (компания, стоящая за Chainlit) для выполнения агентом:

AgentRunExample

AgentRunExample2

Заключение

Agentic RAG представляет собой естественную эволюцию в том, как системы искусственного интеллекта справляются со сложными задачами, требующими интенсивной работы с данными. Используя циклический паттерн взаимодействия, автономно выбирая инструменты и уточняя запросы до достижения высококачественного результата, система выходит за рамки статического следования подсказкам, становясь более адаптивным и осведомленным о контексте решателем задач. Хотя она все еще ограничена инфраструктурой и этическими принципами, определенными человеком, эти агентные возможности позволяют создавать более богатые, динамичные и, в конечном итоге, более полезные взаимодействия с ИИ как для предприятий, так и для конечных пользователей.

Остались вопросы о Agentic RAG?

Присоединяйтесь к Azure AI Foundry Discord, чтобы встретиться с другими учащимися, посетить офисные часы и получить ответы на свои вопросы о AI Agents.

Дополнительные ресурсы

- Реализация Retrieval Augmented Generation (RAG) с использованием Azure OpenAI Service: Узнайте, как использовать собственные данные с Azure OpenAI Service. Этот модуль Microsoft Learn предоставляет подробное руководство по реализации RAG

Научные статьи

Предыдущий урок

Шаблон проектирования использования инструментов

Следующий урок

Создание надежных ИИ-агентов


Отказ от ответственности:
Этот документ был переведен с использованием сервиса автоматического перевода Co-op Translator. Хотя мы стремимся к точности, пожалуйста, имейте в виду, что автоматические переводы могут содержать ошибки или неточности. Оригинальный документ на его исходном языке следует считать авторитетным источником. Для получения критически важной информации рекомендуется профессиональный перевод человеком. Мы не несем ответственности за любые недоразумения или неправильные толкования, возникшие в результате использования данного перевода.