ai-agents-for-beginners

Agentic RAG

(Clicca sull’immagine sopra per guardare il video di questa lezione)

Agentic RAG

Questa lezione offre una panoramica completa sull’Agentic Retrieval-Augmented Generation (Agentic RAG), un paradigma emergente dell’IA in cui i modelli linguistici di grandi dimensioni (LLM) pianificano autonomamente i loro prossimi passi mentre estraggono informazioni da fonti esterne. A differenza dei modelli statici di recupero e lettura, l’Agentic RAG prevede chiamate iterative all’LLM, intervallate da richieste a strumenti o funzioni e output strutturati. Il sistema valuta i risultati, affina le query, invoca strumenti aggiuntivi se necessario e continua questo ciclo fino a raggiungere una soluzione soddisfacente.

Introduzione

Questa lezione coprirà:

Obiettivi di Apprendimento

Dopo aver completato questa lezione, saprai come/comprenderai:

Cos’è l’Agentic RAG?

L’Agentic Retrieval-Augmented Generation (Agentic RAG) è un paradigma emergente dell’IA in cui i modelli linguistici di grandi dimensioni (LLM) pianificano autonomamente i loro prossimi passi mentre estraggono informazioni da fonti esterne. A differenza dei modelli statici di recupero e lettura, l’Agentic RAG prevede chiamate iterative all’LLM, intervallate da richieste a strumenti o funzioni e output strutturati. Il sistema valuta i risultati, affina le query, invoca strumenti aggiuntivi se necessario e continua questo ciclo fino a raggiungere una soluzione soddisfacente. Questo stile iterativo “maker-checker” migliora la correttezza, gestisce query malformate e garantisce risultati di alta qualità.

Il sistema gestisce attivamente il proprio processo di ragionamento, riscrivendo query fallite, scegliendo metodi di recupero diversi e integrando più strumenti—come la ricerca vettoriale in Azure AI Search, database SQL o API personalizzate—prima di finalizzare la risposta. La qualità distintiva di un sistema agentico è la sua capacità di gestire autonomamente il proprio processo di ragionamento. Le implementazioni tradizionali di RAG si affidano a percorsi predefiniti, ma un sistema agentico determina autonomamente la sequenza di passaggi in base alla qualità delle informazioni trovate.

Definizione di Agentic Retrieval-Augmented Generation (Agentic RAG)

L’Agentic Retrieval-Augmented Generation (Agentic RAG) è un paradigma emergente nello sviluppo dell’IA in cui gli LLM non solo estraggono informazioni da fonti di dati esterne, ma pianificano anche autonomamente i loro prossimi passi. A differenza dei modelli statici di recupero e lettura o delle sequenze di prompt attentamente scriptate, l’Agentic RAG prevede un ciclo di chiamate iterative all’LLM, intervallate da richieste a strumenti o funzioni e output strutturati. A ogni passaggio, il sistema valuta i risultati ottenuti, decide se affinare le query, invoca strumenti aggiuntivi se necessario e continua questo ciclo fino a raggiungere una soluzione soddisfacente.

Questo stile iterativo “maker-checker” è progettato per migliorare la correttezza, gestire query malformate verso database strutturati (es. NL2SQL) e garantire risultati bilanciati e di alta qualità. Piuttosto che affidarsi esclusivamente a catene di prompt attentamente ingegnerizzate, il sistema gestisce attivamente il proprio processo di ragionamento. Può riscrivere query fallite, scegliere metodi di recupero diversi e integrare più strumenti—come la ricerca vettoriale in Azure AI Search, database SQL o API personalizzate—prima di finalizzare la risposta. Questo elimina la necessità di framework di orchestrazione eccessivamente complessi. Invece, un ciclo relativamente semplice di “chiamata LLM → utilizzo strumento → chiamata LLM → …” può produrre output sofisticati e ben fondati.

Agentic RAG Core Loop

Gestire il Processo di Ragionamento

La qualità distintiva che rende un sistema “agentico” è la sua capacità di gestire autonomamente il proprio processo di ragionamento. Le implementazioni tradizionali di RAG spesso dipendono da percorsi predefiniti stabiliti dagli esseri umani: una catena di pensieri che delinea cosa recuperare e quando.
Ma quando un sistema è veramente agentico, decide internamente come affrontare il problema. Non sta semplicemente eseguendo uno script; sta determinando autonomamente la sequenza di passaggi in base alla qualità delle informazioni trovate.
Ad esempio, se gli viene chiesto di creare una strategia di lancio di un prodotto, non si affida esclusivamente a un prompt che descrive l’intero flusso di lavoro di ricerca e decisione. Invece, il modello agentico decide autonomamente di:

  1. Recuperare rapporti sulle tendenze di mercato attuali utilizzando Bing Web Grounding.
  2. Identificare dati rilevanti sui concorrenti utilizzando Azure AI Search.
  3. Correlare metriche di vendita interne storiche utilizzando Azure SQL Database.
  4. Sintetizzare i risultati in una strategia coesa orchestrata tramite Azure OpenAI Service.
  5. Valutare la strategia per individuare lacune o incoerenze, avviando un altro ciclo di recupero se necessario.

Tutti questi passaggi—affinare le query, scegliere le fonti, iterare fino a essere “soddisfatti” della risposta—sono decisi dal modello, non pre-scriptati da un essere umano.

Cicli Iterativi, Integrazione di Strumenti e Memoria

Tool Integration Architecture

Un sistema agentico si basa su un modello di interazione ciclico:

Nel tempo, questo crea una sorta di comprensione evolutiva, consentendo al modello di affrontare compiti complessi e multi-step senza richiedere un intervento umano costante o una riformulazione del prompt.

Gestione dei Fallimenti e Auto-Correzione

L’autonomia dell’Agentic RAG include anche meccanismi robusti di auto-correzione. Quando il sistema incontra vicoli ciechi—come il recupero di documenti irrilevanti o query malformate—può:

Questo approccio iterativo e dinamico consente al modello di migliorare continuamente, garantendo che non sia solo un sistema “one-shot” ma uno che apprende dai suoi errori durante una sessione specifica.

Self Correction Mechanism

Limiti dell’Agenzia

Nonostante la sua autonomia all’interno di un compito, l’Agentic RAG non è paragonabile a un’Intelligenza Artificiale Generale. Le sue capacità “agentiche” sono confinate agli strumenti, alle fonti di dati e alle politiche fornite dagli sviluppatori umani. Non può inventare i propri strumenti o uscire dai confini del dominio che gli sono stati assegnati. Piuttosto, eccelle nell’orchestrare dinamicamente le risorse a disposizione.
Le principali differenze rispetto a forme di IA più avanzate includono:

  1. Autonomia Specifica del Dominio: I sistemi Agentic RAG si concentrano sul raggiungimento di obiettivi definiti dall’utente all’interno di un dominio noto, utilizzando strategie come la riscrittura delle query o la selezione degli strumenti per migliorare i risultati.
  2. Dipendenza dall’Infrastruttura: Le capacità del sistema dipendono dagli strumenti e dai dati integrati dagli sviluppatori. Non può superare questi limiti senza intervento umano.
  3. Rispetto delle Linee Guida: Linee guida etiche, regole di conformità e politiche aziendali rimangono molto importanti. La libertà dell’agente è sempre vincolata da misure di sicurezza e meccanismi di supervisione (si spera?).

Casi d’Uso Pratici e Valore

L’Agentic RAG eccelle in scenari che richiedono raffinamento iterativo e precisione:

  1. Ambienti in cui la Correttezza è Prioritaria: In controlli di conformità, analisi normative o ricerche legali, il modello agentico può verificare ripetutamente i fatti, consultare più fonti e riscrivere query fino a produrre una risposta accuratamente verificata.
  2. Interazioni Complesse con Database: Quando si lavora con dati strutturati in cui le query possono spesso fallire o richiedere aggiustamenti, il sistema può affinare autonomamente le sue query utilizzando Azure SQL o Microsoft Fabric OneLake, garantendo che il recupero finale sia allineato con l’intento dell’utente.
  3. Flussi di Lavoro Estesi: Sessioni più lunghe potrebbero evolversi man mano che emergono nuove informazioni. L’Agentic RAG può incorporare continuamente nuovi dati, modificando le strategie mentre apprende di più sul problema.

Governance, Trasparenza e Fiducia

Man mano che questi sistemi diventano più autonomi nel loro ragionamento, governance e trasparenza sono cruciali:

Avere strumenti che forniscono un chiaro registro delle azioni è essenziale. Senza di essi, il debug di un processo multi-step può essere molto difficile. Vedi il seguente esempio da Literal AI (azienda dietro Chainlit) per un’esecuzione di un agente:

AgentRunExample

AgentRunExample2

Conclusione

L’Agentic RAG rappresenta un’evoluzione naturale nel modo in cui i sistemi di IA gestiscono compiti complessi e intensivi di dati. Adottando un modello di interazione ciclico, selezionando autonomamente strumenti e affinando le query fino a ottenere un risultato di alta qualità, il sistema va oltre il semplice seguire i prompt statici, diventando un decisore più adattivo e consapevole del contesto. Sebbene ancora vincolato da infrastrutture e linee guida etiche definite dagli esseri umani, queste capacità agentiche consentono interazioni con l’IA più ricche, dinamiche e, in definitiva, più utili per le imprese e gli utenti finali.

Hai altre domande sull’Agentic RAG?

Unisciti al Discord di Azure AI Foundry per incontrare altri studenti, partecipare agli orari di ricevimento e ottenere risposte alle tue domande sugli AI Agents.

Risorse Aggiuntive

- Implementazione di Retrieval Augmented Generation (RAG) con Azure OpenAI Service: Scopri come utilizzare i tuoi dati con Azure OpenAI Service. Questo modulo di Microsoft Learn fornisce una guida completa all’implementazione di RAG

Articoli Accademici

Lezione Precedente

Tool Use Design Pattern

Prossima Lezione

Building Trustworthy AI Agents


Disclaimer:
Questo documento è stato tradotto utilizzando il servizio di traduzione automatica Co-op Translator. Sebbene ci impegniamo per garantire l’accuratezza, si prega di notare che le traduzioni automatiche possono contenere errori o imprecisioni. Il documento originale nella sua lingua nativa deve essere considerato la fonte autorevole. Per informazioni critiche, si consiglia una traduzione professionale eseguita da un traduttore umano. Non siamo responsabili per eventuali fraintendimenti o interpretazioni errate derivanti dall’uso di questa traduzione.