ai-agents-for-beginners

(Clique na imagem acima para assistir ao vídeo desta lição)

Agentic RAG

Esta lição fornece uma visão geral abrangente do Agentic Retrieval-Augmented Generation (Agentic RAG), um emergente paradigma de IA onde grandes modelos de linguagem (LLMs) planejam autonomamente seus próximos passos enquanto extraem informações de fontes externas. Diferente dos padrões estáticos de recuperação e leitura, o Agentic RAG envolve chamadas iterativas ao LLM, intercaladas com chamadas a ferramentas ou funções e saídas estruturadas. O sistema avalia os resultados, refina consultas, invoca ferramentas adicionais se necessário e continua esse ciclo até alcançar uma solução satisfatória.

Introdução

Esta lição abordará

Entender o Agentic RAG: Aprender sobre o paradigma emergente em IA onde grandes modelos de linguagem (LLMs) planejam autonomamente seus próximos passos enquanto extraem informações de fontes externas de dados.
Compreender o Estilo Iterativo Maker-Checker: Compreender o ciclo de chamadas iterativas ao LLM, intercaladas com chamadas a ferramentas ou funções e saídas estruturadas, projetado para melhorar a correção e lidar com consultas malformadas.
Explorar Aplicações Práticas: Identificar cenários onde o Agentic RAG se destaca, como ambientes que priorizam a correção, interações complexas com bancos de dados e fluxos de trabalho estendidos.

Objetivos de Aprendizagem

Após concluir esta lição, você saberá como/compreenderá:

Compreender o Agentic RAG: Aprender sobre o paradigma emergente em IA onde grandes modelos de linguagem (LLMs) planejam autonomamente seus próximos passos enquanto extraem informações de fontes externas de dados.
Estilo Iterativo Maker-Checker: Entender o conceito de um ciclo de chamadas iterativas ao LLM, intercaladas com chamadas a ferramentas ou funções e saídas estruturadas, projetado para melhorar a correção e lidar com consultas malformadas.
Assumir o Processo de Raciocínio: Compreender a capacidade do sistema de assumir seu processo de raciocínio, tomando decisões sobre como abordar problemas sem depender de caminhos pré-definidos.
Fluxo de Trabalho: Entender como um modelo agentic decide independentemente recuperar relatórios de tendências de mercado, identificar dados de concorrentes, correlacionar métricas internas de vendas, sintetizar descobertas e avaliar a estratégia.
Ciclos Iterativos, Integração de Ferramentas e Memória: Aprender sobre a dependência do sistema em um padrão de interação em loop, mantendo estado e memória ao longo das etapas para evitar loops repetitivos e tomar decisões informadas.
Lidando com Modos de Falha e Auto-Correção: Explorar os robustos mecanismos de auto-correção do sistema, incluindo iterar e reconsultar, usar ferramentas diagnósticas e recorrer à supervisão humana.
Limites da Agência: Entender as limitações do Agentic RAG, focando na autonomia específica do domínio, dependência da infraestrutura e respeito por guardrails.
Casos de Uso Práticos e Valor: Identificar cenários onde o Agentic RAG se destaca, como ambientes que priorizam a correção, interações complexas com bancos de dados e fluxos de trabalho estendidos.
Governança, Transparência e Confiança: Aprender sobre a importância da governança e transparência, incluindo raciocínio explicável, controle de viés e supervisão humana.

O que é Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) é um paradigma emergente de IA onde grandes modelos de linguagem (LLMs) planejam autonomamente seus próximos passos enquanto extraem informações de fontes externas. Diferente dos padrões estáticos de recuperação e leitura, o Agentic RAG envolve chamadas iterativas ao LLM, intercaladas com chamadas a ferramentas ou funções e saídas estruturadas. O sistema avalia os resultados, refina as consultas, invoca ferramentas adicionais se necessário e continua esse ciclo até alcançar uma solução satisfatória. Esse estilo iterativo “maker-checker” melhora a correção, lida com consultas malformadas e garante resultados de alta qualidade.

O sistema assume ativamente seu processo de raciocínio, reescrevendo consultas falhas, escolhendo métodos de recuperação diferentes e integrando múltiplas ferramentas — como busca vetorial no Azure AI Search, bancos de dados SQL ou APIs personalizadas — antes de finalizar sua resposta. A qualidade que diferencia um sistema agentic é sua capacidade de assumir seu processo de raciocínio. Implementações tradicionais de RAG dependem de caminhos pré-definidos, mas um sistema agentic determina autonomamente a sequência de passos com base na qualidade das informações que encontra.

Definindo Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) é um paradigma emergente no desenvolvimento de IA onde os LLMs não só extraem informações de fontes externas de dados, mas também planejam autonomamente seus próximos passos. Diferente dos padrões estáticos de recuperação e leitura ou sequências cuidadosamente roteirizadas de prompts, o Agentic RAG envolve um ciclo de chamadas iterativas ao LLM, intercaladas com chamadas a ferramentas ou funções e saídas estruturadas. A cada etapa, o sistema avalia os resultados obtidos, decide se deve refinar suas consultas, invoca ferramentas adicionais se necessário e continua esse ciclo até alcançar uma solução satisfatória.

Esse estilo iterativo de operação “maker-checker” é projetado para melhorar a correção, lidar com consultas malformadas para bancos de dados estruturados (ex. NL2SQL) e garantir resultados equilibrados e de alta qualidade. Em vez de depender exclusivamente de cadeias de prompt cuidadosamente elaboradas, o sistema assume ativamente seu processo de raciocínio. Ele pode reescrever consultas que falham, escolher métodos diferentes de recuperação e integrar múltiplas ferramentas — como busca vetorial no Azure AI Search, bancos de dados SQL ou APIs personalizadas — antes de finalizar sua resposta. Isso elimina a necessidade de frameworks de orquestração excessivamente complexos. Em vez disso, um loop relativamente simples de “chamada LLM → uso da ferramenta → chamada LLM → …” pode gerar saídas sofisticadas e fundamentadas.

Agentic RAG Core Loop

Assumindo o Processo de Raciocínio

A qualidade distinta que torna um sistema “agentic” é sua capacidade de assumir seu processo de raciocínio. Implementações tradicionais de RAG frequentemente dependem de humanos para pré-definir um caminho para o modelo: uma cadeia de pensamento que delineia o que recuperar e quando. Mas quando um sistema é verdadeiramente agentic, ele decide internamente como abordar o problema. Não está apenas executando um script; está determinando autonomamente a sequência de passos com base na qualidade das informações que encontra.

Por exemplo, se for solicitado a criar uma estratégia de lançamento de produto, não depende exclusivamente de um prompt que descreva todo o fluxo de pesquisa e tomada de decisão. Em vez disso, o modelo agentic decide independentemente:

Recuperar relatórios atuais de tendências de mercado usando Bing Web Grounding
Identificar dados relevantes de concorrentes usando Azure AI Search.
Correlacionar métricas históricas internas de vendas usando Azure SQL Database.
Sintetizar as descobertas em uma estratégia coesa orquestrada via Azure OpenAI Service.
Avaliar a estratégia para lacunas ou inconsistências, solicitando outra rodada de recuperação se necessário.

Todos esses passos — refinar consultas, escolher fontes, iterar até ficar “satisfeito” com a resposta — são decididos pelo modelo, não roteirizados antecipadamente por um humano.

Ciclos Iterativos, Integração de Ferramentas e Memória

Tool Integration Architecture

Um sistema agentic depende de um padrão de interação em loop:

Chamada Inicial: O objetivo do usuário (ou seja, o prompt do usuário) é apresentado ao LLM.
Invocação de Ferramenta: Se o modelo identifica informações faltantes ou instruções ambíguas, ele seleciona uma ferramenta ou método de recuperação — como uma consulta a banco de dados vetorial (ex. busca híbrida Azure AI Search sobre dados privados) ou uma chamada SQL estruturada — para obter mais contexto.
Avaliação & Refinamento: Após revisar os dados retornados, o modelo decide se as informações são suficientes. Caso contrário, ele refina a consulta, tenta uma ferramenta diferente ou ajusta sua abordagem.
Repetir Até Satisfazer: Esse ciclo continua até o modelo determinar que tem clareza e evidências suficientes para fornecer uma resposta final, bem fundamentada.
Memória & Estado: Como o sistema mantém estado e memória ao longo das etapas, pode recordar tentativas anteriores e seus resultados, evitando ciclos repetitivos e tomando decisões mais informadas conforme avança.

Com o tempo, isso cria uma sensação de entendimento evolutivo, permitindo que o modelo navegue em tarefas complexas, de múltiplas etapas, sem exigir intervenção humana constante ou reformulação do prompt.

Lidando com Modos de Falha e Auto-Correção

A autonomia do Agentic RAG também envolve robustos mecanismos de auto-correção. Quando o sistema atinge becos sem saída — como recuperar documentos irrelevantes ou encontrar consultas malformadas — ele pode:

Iterar e Reconsultar: Em vez de retornar respostas de baixo valor, o modelo tenta novas estratégias de busca, reescreve consultas ao banco de dados ou examina conjuntos de dados alternativos.
Usar Ferramentas Diagnósticas: O sistema pode invocar funções adicionais projetadas para ajudá-lo a depurar seus passos de raciocínio ou confirmar a correção dos dados recuperados. Ferramentas como Azure AI Tracing serão importantes para habilitar observabilidade e monitoramento robustos.
Recorrer à Supervisão Humana: Para cenários de alto risco ou falhas repetidas, o modelo pode sinalizar incerteza e solicitar orientação humana. Uma vez que o humano fornece feedback corretivo, o modelo pode incorporar essa lição nas futuras interações.

Essa abordagem iterativa e dinâmica permite que o modelo melhore continuamente, garantindo que ele não seja apenas um sistema de uso único, mas um que aprende com seus erros durante uma sessão específica.

Self Correction Mechanism

Limites da Agência

Apesar de sua autonomia dentro de uma tarefa, o Agentic RAG não é análogo à Inteligência Artificial Geral. Suas capacidades “agentic” estão confinadas às ferramentas, fontes de dados e políticas fornecidas por desenvolvedores humanos. Ele não pode inventar suas próprias ferramentas nem exceder os limites de domínio definidos. Em vez disso, ele se destaca na orquestração dinâmica dos recursos disponíveis.

Diferenças chave em relação a formas de IA mais avançadas incluem:

Autonomia Específica de Domínio: Os sistemas Agentic RAG focam em alcançar metas definidas pelo usuário dentro de um domínio conhecido, empregando estratégias como reescrita de consultas ou seleção de ferramentas para melhorar resultados.
Dependência da Infraestrutura: As capacidades do sistema dependem das ferramentas e dados integrados pelos desenvolvedores. Ele não pode ultrapassar esses limites sem intervenção humana.
Respeito a Guardrails: Diretrizes éticas, regras de conformidade e políticas empresariais continuam muito importantes. A liberdade do agente é sempre limitada por medidas de segurança e mecanismos de supervisão (esperançosamente?)

Casos Práticos de Uso e Valor

Agentic RAG se destaca em cenários que requerem refinamento iterativo e precisão:

Ambientes que Priorizam a Correção: Em verificações de conformidade, análise regulatória ou pesquisa jurídica, o modelo agentic pode verificar fatos repetidamente, consultar múltiplas fontes e reescrever consultas até produzir uma resposta rigorosamente verificada.
Interações Complexas com Bancos de Dados: Ao lidar com dados estruturados onde consultas frequentemente falham ou precisam de ajuste, o sistema pode refinar autonomamente suas consultas usando Azure SQL ou Microsoft Fabric OneLake, garantindo que a recuperação final se alinhe à intenção do usuário.
Fluxos de Trabalho Estendidos: Sessões mais longas podem evoluir conforme novas informações surgem. O Agentic RAG pode continuamente incorporar novos dados, ajustando estratégias conforme aprende mais sobre o espaço do problema.

Governança, Transparência e Confiança

À medida que esses sistemas se tornam mais autônomos em seu raciocínio, governança e transparência são cruciais:

Raciocínio Explicável: O modelo pode fornecer um registro das consultas feitas, das fontes consultadas e dos passos de raciocínio seguidos para chegar à conclusão. Ferramentas como Azure AI Content Safety e Azure AI Tracing / GenAIOps ajudam a manter transparência e mitigar riscos.
Controle de Viés e Recuperação Balanceada: Desenvolvedores podem ajustar estratégias de recuperação para garantir que fontes de dados equilibradas e representativas sejam consideradas, auditando regularmente as saídas para detectar viés ou padrões distorcidos usando modelos personalizados para organizações avançadas de ciência de dados com Azure Machine Learning.
Supervisão Humana e Conformidade: Para tarefas sensíveis, a revisão humana continua essencial. Agentic RAG não substitui o julgamento humano em decisões de alto impacto — ele o complementa entregando opções mais rigorosamente verificadas.

Ter ferramentas que fornecem um registro claro das ações é essencial. Sem elas, depurar um processo de múltiplas etapas pode ser muito difícil. Veja o seguinte exemplo da Literal AI (empresa por trás do Chainlit) de uma execução de agente:

AgentRunExample

Conclusão

Agentic RAG representa uma evolução natural na forma como sistemas de IA lidam com tarefas complexas e intensivas em dados. Ao adotar um padrão de interação em loop, selecionar ferramentas autonomamente e refinar consultas até alcançar um resultado de alta qualidade, o sistema vai além do simples acompanhamento de prompts estáticos para um tomador de decisão mais adaptativo e ciente do contexto. Ainda que limitado por infraestruturas definidas por humanos e diretrizes éticas, essas capacidades agentic permitem interações de IA mais ricas, dinâmicas e, em última análise, mais úteis tanto para empresas quanto para usuários finais.

Tem Mais Perguntas sobre Agentic RAG?

Junte-se ao Microsoft Foundry Discord para se encontrar com outros aprendizes, participar de horários de atendimento e tirar suas dúvidas sobre Agentes de IA.

Recursos Adicionais

Artigos Acadêmicos

Aula Anterior

Design Pattern de Uso de Ferramentas

Próxima Aula

Construindo Agentes de IA Confiáveis

Aviso Legal:
Este documento foi traduzido utilizando o serviço de tradução por IA Co-op Translator. Embora nos esforcemos para garantir a precisão, por favor, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autorizada. Para informações críticas, recomenda-se tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução.

This site is open source. Improve this page.