ai-agents-for-beginners

Agentic RAG

(Cliquez sur l’image ci-dessus pour voir la vidéo de cette leçon)

Agentic RAG

Cette leçon offre une vue d’ensemble complète de l’Agentic Retrieval-Augmented Generation (Agentic RAG), un paradigme émergent de l’IA où les grands modèles de langage (LLMs) planifient de manière autonome leurs prochaines étapes tout en récupérant des informations provenant de sources externes. Contrairement aux modèles statiques de récupération puis lecture, Agentic RAG implique des appels itératifs au LLM, entrecoupés d’appels à des outils ou fonctions et de sorties structurées. Le système évalue les résultats, affine les requêtes, invoque des outils supplémentaires si nécessaire, et poursuit ce cycle jusqu’à ce qu’une solution satisfaisante soit obtenue.

Introduction

Cette leçon couvrira :

Objectifs d’apprentissage

Après avoir terminé cette leçon, vous saurez comment/comprendre :

Qu’est-ce qu’Agentic RAG ?

Agentic Retrieval-Augmented Generation (Agentic RAG) est un paradigme émergent de l’IA où les grands modèles de langage (LLMs) planifient de manière autonome leurs prochaines étapes tout en récupérant des informations provenant de sources externes. Contrairement aux modèles statiques de récupération puis lecture, Agentic RAG implique des appels itératifs au LLM, entrecoupés d’appels à des outils ou fonctions et de sorties structurées. Le système évalue les résultats, affine les requêtes, invoque des outils supplémentaires si nécessaire, et poursuit ce cycle jusqu’à ce qu’une solution satisfaisante soit obtenue.

Le système s’approprie activement son processus de raisonnement, réécrit les requêtes échouées, choisit différentes méthodes de récupération et intègre plusieurs outils—tels que la recherche vectorielle dans Azure AI Search, des bases de données SQL ou des API personnalisées—avant de finaliser sa réponse. La qualité distinctive d’un système agentique est sa capacité à s’approprier son processus de raisonnement. Les implémentations traditionnelles de RAG reposent sur des chemins prédéfinis, mais un système agentique détermine de manière autonome la séquence des étapes en fonction de la qualité des informations qu’il trouve.

Définir Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) est un paradigme émergent dans le développement de l’IA où les LLMs ne se contentent pas de récupérer des informations provenant de sources de données externes, mais planifient également leurs prochaines étapes de manière autonome. Contrairement aux modèles statiques de récupération puis lecture ou aux séquences de prompts soigneusement scriptées, Agentic RAG implique un cycle d’appels itératifs au LLM, entrecoupés d’appels à des outils ou fonctions et de sorties structurées. À chaque étape, le système évalue les résultats obtenus, décide s’il doit affiner ses requêtes, invoque des outils supplémentaires si nécessaire, et poursuit ce cycle jusqu’à ce qu’il atteigne une solution satisfaisante.

Ce style itératif “maker-checker” est conçu pour améliorer la précision, gérer les requêtes malformées vers des bases de données structurées (par exemple NL2SQL), et garantir des résultats équilibrés et de haute qualité. Plutôt que de s’appuyer uniquement sur des chaînes de prompts soigneusement conçues, le système s’approprie activement son processus de raisonnement. Il peut réécrire des requêtes échouées, choisir différentes méthodes de récupération et intégrer plusieurs outils—tels que la recherche vectorielle dans Azure AI Search, des bases de données SQL ou des API personnalisées—avant de finaliser sa réponse. Cela élimine le besoin de cadres d’orchestration excessivement complexes. À la place, une boucle relativement simple de “appel LLM → utilisation d’outil → appel LLM → …” peut produire des sorties sophistiquées et bien fondées.

Agentic RAG Core Loop

Appropriation du processus de raisonnement

La qualité distinctive qui rend un système “agentique” est sa capacité à s’approprier son processus de raisonnement. Les implémentations traditionnelles de RAG dépendent souvent des humains pour prédéfinir un chemin pour le modèle : une chaîne de pensée qui décrit quoi récupérer et quand. Mais lorsqu’un système est véritablement agentique, il décide en interne comment aborder le problème. Il ne se contente pas d’exécuter un script ; il détermine de manière autonome la séquence des étapes en fonction de la qualité des informations qu’il trouve.

Par exemple, s’il est demandé de créer une stratégie de lancement de produit, il ne se repose pas uniquement sur un prompt qui détaille tout le flux de travail de recherche et de prise de décision. À la place, le modèle agentique décide de manière autonome de :

  1. Récupérer des rapports sur les tendances actuelles du marché en utilisant Bing Web Grounding.
  2. Identifier des données pertinentes sur les concurrents en utilisant Azure AI Search.
  3. Corréler des métriques internes historiques de ventes en utilisant Azure SQL Database.
  4. Synthétiser les résultats dans une stratégie cohérente orchestrée via Azure OpenAI Service.
  5. Évaluer la stratégie pour détecter des lacunes ou incohérences, en lançant une nouvelle série de récupérations si nécessaire.

Toutes ces étapes—affiner les requêtes, choisir les sources, itérer jusqu’à être “satisfait” de la réponse—sont décidées par le modèle, et non prédéfinies par un humain.

Boucles itératives, intégration d’outils et mémoire

Tool Integration Architecture

Un système agentique repose sur un modèle d’interaction en boucle :

Avec le temps, cela crée un sentiment de compréhension évolutive, permettant au modèle de naviguer dans des tâches complexes et multi-étapes sans nécessiter une intervention humaine constante ou une reformulation du prompt.

Gestion des modes d’échec et auto-correction

L’autonomie d’Agentic RAG implique également des mécanismes robustes d’auto-correction. Lorsque le système rencontre des impasses—comme récupérer des documents non pertinents ou rencontrer des requêtes malformées—il peut :

Cette approche itérative et dynamique permet au modèle de s’améliorer continuellement, garantissant qu’il ne s’agit pas seulement d’un système à usage unique, mais d’un système qui apprend de ses erreurs au cours d’une session donnée.

Self Correction Mechanism

Limites de l’autonomie

Malgré son autonomie dans une tâche, Agentic RAG n’est pas analogue à une intelligence artificielle générale. Ses capacités “agentiques” sont limitées aux outils, sources de données et politiques fournies par les développeurs humains. Il ne peut pas inventer ses propres outils ni sortir des limites du domaine qui lui ont été fixées. À la place, il excelle dans l’orchestration dynamique des ressources disponibles.

Les différences clés par rapport à des formes d’IA plus avancées incluent :

  1. Autonomie spécifique au domaine : Les systèmes Agentic RAG sont axés sur l’atteinte d’objectifs définis par l’utilisateur dans un domaine connu, en employant des stratégies telles que la réécriture de requêtes ou la sélection d’outils pour améliorer les résultats.
  2. Dépendance à l’infrastructure : Les capacités du système dépendent des outils et des données intégrés par les développeurs. Il ne peut pas dépasser ces limites sans intervention humaine.
  3. Respect des garde-fous : Les directives éthiques, les règles de conformité et les politiques commerciales restent très importantes. La liberté de l’agent est toujours contrainte par des mesures de sécurité et des mécanismes de supervision (espérons-le ?).

Cas d’utilisation pratiques et valeur

Agentic RAG excelle dans les scénarios nécessitant un raffinement itératif et une précision :

  1. Environnements axés sur la précision : Dans les vérifications de conformité, l’analyse réglementaire ou la recherche juridique, le modèle agentique peut vérifier les faits à plusieurs reprises, consulter plusieurs sources et réécrire des requêtes jusqu’à produire une réponse soigneusement vérifiée.
  2. Interactions complexes avec des bases de données : Lorsqu’il s’agit de données structurées où les requêtes échouent souvent ou nécessitent des ajustements, le système peut affiner ses requêtes de manière autonome en utilisant Azure SQL ou Microsoft Fabric OneLake, garantissant que la récupération finale correspond à l’intention de l’utilisateur.
  3. Flux de travail étendus : Les sessions de longue durée peuvent évoluer à mesure que de nouvelles informations apparaissent. Agentic RAG peut intégrer continuellement de nouvelles données, modifiant ses stratégies à mesure qu’il en apprend davantage sur l’espace problématique.

Gouvernance, transparence et confiance

À mesure que ces systèmes deviennent plus autonomes dans leur raisonnement, la gouvernance et la transparence sont cruciales :

Disposer d’outils qui fournissent un enregistrement clair des actions est essentiel. Sans eux, déboguer un processus multi-étapes peut être très difficile. Voir l’exemple suivant de Literal AI (entreprise derrière Chainlit) pour une exécution d’agent :

AgentRunExample

AgentRunExample2

Conclusion

Agentic RAG représente une évolution naturelle dans la manière dont les systèmes d’IA gèrent des tâches complexes et intensives en données. En adoptant un modèle d’interaction en boucle, en sélectionnant des outils de manière autonome et en affinant les requêtes jusqu’à obtenir un résultat de haute qualité, le système dépasse le suivi statique des prompts pour devenir un décideur plus adaptatif et conscient du contexte. Bien qu’il reste limité par les infrastructures définies par les humains et les directives éthiques, ces capacités agentiques permettent des interactions IA plus riches, dynamiques et, en fin de compte, plus utiles pour les entreprises et les utilisateurs finaux.

Vous avez d’autres questions sur Agentic RAG ?

Rejoignez le Discord Azure AI Foundry pour rencontrer d’autres apprenants, assister à des heures de bureau et obtenir des réponses à vos questions sur les agents IA.

Ressources supplémentaires

- Implémenter la génération augmentée par récupération (RAG) avec Azure OpenAI Service : Apprenez à utiliser vos propres données avec Azure OpenAI Service. Ce module Microsoft Learn fournit un guide complet sur la mise en œuvre de RAG.

Articles académiques

Leçon précédente

Modèle de conception pour l’utilisation d’outils

Leçon suivante

Construire des agents IA fiables


Avertissement :
Ce document a été traduit à l’aide du service de traduction automatique Co-op Translator. Bien que nous nous efforcions d’assurer l’exactitude, veuillez noter que les traductions automatisées peuvent contenir des erreurs ou des inexactitudes. Le document original dans sa langue d’origine doit être considéré comme la source faisant autorité. Pour des informations critiques, il est recommandé de faire appel à une traduction professionnelle humaine. Nous déclinons toute responsabilité en cas de malentendus ou d’interprétations erronées résultant de l’utilisation de cette traduction.