ai-agents-for-beginners

Agentic RAG

(Clicca sull’immagine sopra per guardare il video di questa lezione)

Agentic RAG

Questa lezione fornisce una panoramica completa di Agentic Retrieval-Augmented Generation (Agentic RAG), un paradigma emergente dell’IA in cui i grandi modelli linguistici (LLM) pianificano autonomamente i propri passi successivi mentre estraggono informazioni da fonti esterne. A differenza dei modelli statici di recupero e poi lettura, Agentic RAG prevede chiamate iterative al LLM, intervallate da chiamate a strumenti o funzioni e output strutturati. Il sistema valuta i risultati, affina le query, invoca ulteriori strumenti se necessario e continua questo ciclo fino a raggiungere una soluzione soddisfacente.

Introduzione

Questa lezione coprirà

Obiettivi di Apprendimento

Dopo aver completato questa lezione, saprai come/comprendere:

Cos’è Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) è un paradigma emergente di IA in cui i grandi modelli linguistici (LLM) pianificano autonomamente i propri passi successivi mentre estraggono informazioni da fonti esterne. A differenza dei modelli statici di recupero e poi lettura, Agentic RAG prevede chiamate iterative al LLM, intervallate da chiamate a strumenti o funzioni e output strutturati. Il sistema valuta i risultati, affina le query, invoca ulteriori strumenti se necessario e continua questo ciclo fino a ottenere una soluzione soddisfacente. Questo stile iterativo “maker-checker” migliora la correttezza, gestisce query malformate e assicura risultati di alta qualità.

Il sistema possiede attivamente il proprio processo di ragionamento, riscrivendo query fallite, scegliendo metodi di recupero diversi e integrando più strumenti—come la ricerca vettoriale in Azure AI Search, database SQL o API personalizzate—prima di finalizzare la risposta. La qualità distintiva di un sistema agentico è la capacità di possedere il proprio processo di ragionamento. Le implementazioni RAG tradizionali si basano su percorsi predefiniti, ma un sistema agentico determina autonomamente la sequenza di passi basandosi sulla qualità delle informazioni trovate.

Definizione di Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) è un paradigma emergente nello sviluppo dell’IA in cui i LLM non solo estraggono informazioni da fonti dati esterne, ma pianificano anche autonomamente i prossimi passi. A differenza dei modelli statici di recupero-then-read o di sequenze di prompt accuratamente scriptate, Agentic RAG prevede un ciclo di chiamate iterative al LLM, intervallate da chiamate a strumenti o funzioni e output strutturati. Ad ogni passaggio, il sistema valuta i risultati ottenuti, decide se affinare le query, invoca strumenti aggiuntivi se necessario e continua questo ciclo finché non ottiene una soluzione soddisfacente.

Questo stile iterativo “maker-checker” è progettato per migliorare la correttezza, gestire query malformate a database strutturati (es. NL2SQL) e garantire risultati equilibrati e di alta qualità. Invece di affidarsi solamente a catene di prompt ingegnerizzate con cura, il sistema possiede attivamente il proprio processo di ragionamento. Può riscrivere query fallite, scegliere metodi di recupero diversi e integrare molteplici strumenti—come la ricerca vettoriale in Azure AI Search, database SQL o API personalizzate—prima di finalizzare la risposta. Questo elimina la necessità di framework di orchestrazione eccessivamente complessi. Invece, un ciclo relativamente semplice di “chiamata LLM → uso dello strumento → chiamata LLM → …” può fornire output sofisticati e ben fondati.

Agentic RAG Core Loop

Padroneggiare il Processo di Ragionamento

La qualità distintiva che rende un sistema “agentico” è la sua capacità di possedere il proprio processo di ragionamento. Le implementazioni RAG tradizionali spesso dipendono da umani che predefiniscono un percorso per il modello: una catena di pensieri che definisce cosa recuperare e quando. Ma quando un sistema è veramente agentico, decide internamente come affrontare il problema. Non esegue semplicemente uno script; determina autonomamente la sequenza dei passi basandosi sulla qualità delle informazioni trovate. Per esempio, se gli viene chiesto di creare una strategia di lancio prodotto, non si affida solo a un prompt che esplicita l’intero flusso di ricerca e decisione. Invece, il modello agentico decide autonomamente di:

  1. Recuperare report sulle tendenze attuali del mercato usando Bing Web Grounding
  2. Identificare dati rilevanti dei concorrenti usando Azure AI Search.
  3. Correlare metriche storiche di vendita interna usando Azure SQL Database.
  4. Sintetizzare i risultati in una strategia coerente orchestrata tramite Azure OpenAI Service.
  5. Valutare la strategia per lacune o incoerenze, attivando un altro ciclo di recupero se necessario. Tutti questi passaggi—rifinire query, scegliere fonti, iterare fino a essere “soddisfatti” della risposta—sono decisi dal modello, non pre-scritti da un umano.

Cicli Iterativi, Integrazione di Strumenti e Memoria

Tool Integration Architecture

Un sistema agentico si basa su un modello di interazione ciclico:

Col tempo, questo crea una sensazione di comprensione evolutiva, permettendo al modello di navigare compiti complessi a più passaggi senza richiedere un intervento umano costante o la riformulazione del prompt.

Gestione dei Modelli di Fallimento e Auto-Correzione

L’autonomia di Agentic RAG comprende anche robusti meccanismi di auto-correzione. Quando il sistema incontra vicoli ciechi—come recuperare documenti irrilevanti o incorrere in query malformate—può:

Questo approccio iterativo e dinamico consente al modello di migliorare continuamente, assicurando che non sia semplicemente un sistema “one-shot” ma uno che apprende dai propri errori durante ciascuna sessione.

Self Correction Mechanism

Limiti dell’Agency

Nonostante la sua autonomia all’interno di un compito, Agentic RAG non è analogo a un’Intelligenza Artificiale Generale. Le sue capacità “agentiche” sono confinate agli strumenti, alle fonti dati e alle policy fornite dagli sviluppatori umani. Non può inventare propri strumenti né uscire dai confini di dominio stabiliti. Piuttosto, eccelle nell’orchestrare dinamicamente le risorse a disposizione. Differenze chiave rispetto a forme di IA più avanzate includono:

  1. Autonomia Specifica del Dominio: I sistemi Agentic RAG sono focalizzati sul raggiungimento di obiettivi definiti dall’utente all’interno di un dominio noto, impiegando strategie come la riscrittura di query o la selezione di strumenti per migliorare i risultati.
  2. Dipendenza dall’Infrastruttura: Le capacità del sistema dipendono dagli strumenti e dati integrati dagli sviluppatori. Non può superare questi limiti senza intervento umano.
  3. Rispetto delle Regole di Sicurezza: Linee guida etiche, norme di conformità e policy aziendali restano molto importanti. La libertà dell’agente è sempre vincolata da misure di sicurezza e meccanismi di supervisione (si spera).

Casi d’Uso Pratici e Valore

Agentic RAG eccelle in scenari che richiedono raffinamento iterativo e precisione:

  1. Ambienti incentrati sulla Correttezza: In controlli di conformità, analisi regolamentari o ricerche legali, il modello agentico può verificare ripetutamente fatti, consultare fonti multiple e riscrivere query finché non produce una risposta accuratamente verificata.
  2. Interazioni Complesse con Database: Nella gestione di dati strutturati dove le query possono spesso fallire o necessitare aggiustamenti, il sistema può raffinare autonomamente le query usando Azure SQL o Microsoft Fabric OneLake, assicurando che il recupero finale rispecchi l’intento dell’utente.
  3. Flussi di Lavoro Estesi: Sessioni di lunga durata possono evolvere man mano che emergono nuove informazioni. Agentic RAG può incorporare continuamente nuovi dati, adattando strategie mentre apprende di più sul problema.

Governance, Trasparenza e Fiducia

Man mano che questi sistemi diventano più autonomi nel ragionamento, governance e trasparenza sono cruciali:

Avere strumenti che forniscono un chiaro registro delle azioni è essenziale. Senza di essi, il debug di un processo a più fasi può essere molto difficile. Vedi l’esempio seguente da Literal AI (azienda dietro Chainlit) per una sessione Agent:

AgentRunExample

Conclusione

Agentic RAG rappresenta un’evoluzione naturale nel modo in cui i sistemi IA gestiscono compiti complessi e intensivi di dati. Adottando un modello di interazione ciclico, selezionando autonomamente gli strumenti e raffinando le query fino a ottenere risultati di alta qualità, il sistema supera il semplice follow-up di prompt statici per diventare un decisore più adattivo e consapevole del contesto. Pur essendo ancora vincolato da infrastrutture definite dall’umano e linee guida etiche, queste capacità agentiche permettono interazioni IA più ricche, dinamiche e infine più utili sia per le imprese che per gli utenti finali.

Hai altre domande su Agentic RAG?

Unisciti al Microsoft Foundry Discord per incontrare altri studenti, partecipare alle ore di ufficio e ottenere risposte alle tue domande sugli AI Agents.

Risorse Aggiuntive

Articoli accademici

Lezione precedente

Tool Use Design Pattern

Lezione successiva

Costruire agenti AI affidabili


Dichiarazione di non responsabilità: Questo documento è stato tradotto utilizzando il servizio di traduzione automatica Co-op Translator. Pur impegnandoci per l’accuratezza, si prega di considerare che le traduzioni automatiche possono contenere errori o imprecisioni. Il documento originale nella sua lingua nativa deve essere considerato la fonte autorevole. Per informazioni critiche, si raccomanda la traduzione professionale effettuata da un essere umano. Non siamo responsabili per eventuali incomprensioni o interpretazioni errate derivanti dall’uso di questa traduzione.