(Clique na imagem acima para assistir ao vídeo desta lição)
Esta lição fornece uma visão geral abrangente do Agentic Retrieval-Augmented Generation (Agentic RAG), um emergente paradigma de IA onde grandes modelos de linguagem (LLMs) planejam autonomamente seus próximos passos enquanto extraem informações de fontes externas. Diferente dos padrões estáticos de recuperação e leitura, o Agentic RAG envolve chamadas iterativas ao LLM, intercaladas com chamadas a ferramentas ou funções e saídas estruturadas. O sistema avalia os resultados, refina consultas, invoca ferramentas adicionais se necessário e continua esse ciclo até alcançar uma solução satisfatória.
Esta lição abordará
Após concluir esta lição, você saberá como/compreenderá:
Agentic Retrieval-Augmented Generation (Agentic RAG) é um paradigma emergente de IA onde grandes modelos de linguagem (LLMs) planejam autonomamente seus próximos passos enquanto extraem informações de fontes externas. Diferente dos padrões estáticos de recuperação e leitura, o Agentic RAG envolve chamadas iterativas ao LLM, intercaladas com chamadas a ferramentas ou funções e saídas estruturadas. O sistema avalia os resultados, refina as consultas, invoca ferramentas adicionais se necessário e continua esse ciclo até alcançar uma solução satisfatória. Esse estilo iterativo “maker-checker” melhora a correção, lida com consultas malformadas e garante resultados de alta qualidade.
O sistema assume ativamente seu processo de raciocínio, reescrevendo consultas falhas, escolhendo métodos de recuperação diferentes e integrando múltiplas ferramentas — como busca vetorial no Azure AI Search, bancos de dados SQL ou APIs personalizadas — antes de finalizar sua resposta. A qualidade que diferencia um sistema agentic é sua capacidade de assumir seu processo de raciocínio. Implementações tradicionais de RAG dependem de caminhos pré-definidos, mas um sistema agentic determina autonomamente a sequência de passos com base na qualidade das informações que encontra.
Agentic Retrieval-Augmented Generation (Agentic RAG) é um paradigma emergente no desenvolvimento de IA onde os LLMs não só extraem informações de fontes externas de dados, mas também planejam autonomamente seus próximos passos. Diferente dos padrões estáticos de recuperação e leitura ou sequências cuidadosamente roteirizadas de prompts, o Agentic RAG envolve um ciclo de chamadas iterativas ao LLM, intercaladas com chamadas a ferramentas ou funções e saídas estruturadas. A cada etapa, o sistema avalia os resultados obtidos, decide se deve refinar suas consultas, invoca ferramentas adicionais se necessário e continua esse ciclo até alcançar uma solução satisfatória.
Esse estilo iterativo de operação “maker-checker” é projetado para melhorar a correção, lidar com consultas malformadas para bancos de dados estruturados (ex. NL2SQL) e garantir resultados equilibrados e de alta qualidade. Em vez de depender exclusivamente de cadeias de prompt cuidadosamente elaboradas, o sistema assume ativamente seu processo de raciocínio. Ele pode reescrever consultas que falham, escolher métodos diferentes de recuperação e integrar múltiplas ferramentas — como busca vetorial no Azure AI Search, bancos de dados SQL ou APIs personalizadas — antes de finalizar sua resposta. Isso elimina a necessidade de frameworks de orquestração excessivamente complexos. Em vez disso, um loop relativamente simples de “chamada LLM → uso da ferramenta → chamada LLM → …” pode gerar saídas sofisticadas e fundamentadas.

A qualidade distinta que torna um sistema “agentic” é sua capacidade de assumir seu processo de raciocínio. Implementações tradicionais de RAG frequentemente dependem de humanos para pré-definir um caminho para o modelo: uma cadeia de pensamento que delineia o que recuperar e quando. Mas quando um sistema é verdadeiramente agentic, ele decide internamente como abordar o problema. Não está apenas executando um script; está determinando autonomamente a sequência de passos com base na qualidade das informações que encontra.
Por exemplo, se for solicitado a criar uma estratégia de lançamento de produto, não depende exclusivamente de um prompt que descreva todo o fluxo de pesquisa e tomada de decisão. Em vez disso, o modelo agentic decide independentemente:
Todos esses passos — refinar consultas, escolher fontes, iterar até ficar “satisfeito” com a resposta — são decididos pelo modelo, não roteirizados antecipadamente por um humano.

Um sistema agentic depende de um padrão de interação em loop:
Com o tempo, isso cria uma sensação de entendimento evolutivo, permitindo que o modelo navegue em tarefas complexas, de múltiplas etapas, sem exigir intervenção humana constante ou reformulação do prompt.
A autonomia do Agentic RAG também envolve robustos mecanismos de auto-correção. Quando o sistema atinge becos sem saída — como recuperar documentos irrelevantes ou encontrar consultas malformadas — ele pode:
Essa abordagem iterativa e dinâmica permite que o modelo melhore continuamente, garantindo que ele não seja apenas um sistema de uso único, mas um que aprende com seus erros durante uma sessão específica.

Apesar de sua autonomia dentro de uma tarefa, o Agentic RAG não é análogo à Inteligência Artificial Geral. Suas capacidades “agentic” estão confinadas às ferramentas, fontes de dados e políticas fornecidas por desenvolvedores humanos. Ele não pode inventar suas próprias ferramentas nem exceder os limites de domínio definidos. Em vez disso, ele se destaca na orquestração dinâmica dos recursos disponíveis.
Diferenças chave em relação a formas de IA mais avançadas incluem:
Agentic RAG se destaca em cenários que requerem refinamento iterativo e precisão:
À medida que esses sistemas se tornam mais autônomos em seu raciocínio, governança e transparência são cruciais:
Ter ferramentas que fornecem um registro claro das ações é essencial. Sem elas, depurar um processo de múltiplas etapas pode ser muito difícil. Veja o seguinte exemplo da Literal AI (empresa por trás do Chainlit) de uma execução de agente:

Agentic RAG representa uma evolução natural na forma como sistemas de IA lidam com tarefas complexas e intensivas em dados. Ao adotar um padrão de interação em loop, selecionar ferramentas autonomamente e refinar consultas até alcançar um resultado de alta qualidade, o sistema vai além do simples acompanhamento de prompts estáticos para um tomador de decisão mais adaptativo e ciente do contexto. Ainda que limitado por infraestruturas definidas por humanos e diretrizes éticas, essas capacidades agentic permitem interações de IA mais ricas, dinâmicas e, em última análise, mais úteis tanto para empresas quanto para usuários finais.
Junte-se ao Microsoft Foundry Discord para se encontrar com outros aprendizes, participar de horários de atendimento e tirar suas dúvidas sobre Agentes de IA.
Design Pattern de Uso de Ferramentas
Construindo Agentes de IA Confiáveis
Aviso Legal:
Este documento foi traduzido utilizando o serviço de tradução por IA Co-op Translator. Embora nos esforcemos para garantir a precisão, por favor, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autorizada. Para informações críticas, recomenda-se tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução.