ai-agents-for-beginners

Agentic RAG

(Clicca sull’immagine sopra per vedere il video di questa lezione)

Agentic RAG

Questa lezione offre una panoramica completa su Agentic Retrieval-Augmented Generation (Agentic RAG), un paradigma emergente dell’IA in cui i modelli di linguaggio di grandi dimensioni (LLM) pianificano autonomamente i loro prossimi passi mentre estraggono informazioni da fonti esterne. A differenza dei modelli statici di recupero e lettura, Agentic RAG prevede chiamate iterative al LLM, intervallate da chiamate a strumenti o funzioni e output strutturati. Il sistema valuta i risultati, perfeziona le query, utilizza strumenti aggiuntivi se necessario e continua questo ciclo fino a raggiungere una soluzione soddisfacente.

Introduzione

Questa lezione coprirà:

Obiettivi di Apprendimento

Dopo aver completato questa lezione, saprai come/comprenderai:

Cos’è Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) è un paradigma emergente dell’IA in cui i modelli di linguaggio di grandi dimensioni (LLM) pianificano autonomamente i loro prossimi passi mentre estraggono informazioni da fonti esterne. A differenza dei modelli statici di recupero e lettura, Agentic RAG prevede chiamate iterative al LLM, intervallate da chiamate a strumenti o funzioni e output strutturati. Il sistema valuta i risultati, perfeziona le query, utilizza strumenti aggiuntivi se necessario e continua questo ciclo fino a raggiungere una soluzione soddisfacente. Questo stile iterativo “maker-checker” migliora la correttezza, gestisce query malformate e garantisce risultati di alta qualità.

Il sistema gestisce attivamente il proprio processo di ragionamento, riscrivendo query fallite, scegliendo metodi di recupero diversi e integrando più strumenti—come la ricerca vettoriale in Azure AI Search, database SQL o API personalizzate—prima di finalizzare la risposta. La qualità distintiva di un sistema agentico è la sua capacità di gestire autonomamente il proprio processo di ragionamento. Le implementazioni tradizionali di RAG si basano su percorsi predefiniti, ma un sistema agentico determina autonomamente la sequenza di passaggi in base alla qualità delle informazioni che trova.

Definizione di Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) è un paradigma emergente nello sviluppo dell’IA in cui i LLM non solo estraggono informazioni da fonti di dati esterne, ma pianificano anche autonomamente i loro prossimi passi. A differenza dei modelli statici di recupero e lettura o delle sequenze di prompt attentamente scriptate, Agentic RAG prevede un ciclo di chiamate iterative al LLM, intervallate da chiamate a strumenti o funzioni e output strutturati. Ad ogni passaggio, il sistema valuta i risultati ottenuti, decide se perfezionare le query, utilizza strumenti aggiuntivi se necessario e continua questo ciclo fino a raggiungere una soluzione soddisfacente.

Questo stile iterativo “maker-checker” è progettato per migliorare la correttezza, gestire query malformate verso database strutturati (es. NL2SQL) e garantire risultati bilanciati e di alta qualità. Piuttosto che affidarsi esclusivamente a catene di prompt attentamente progettate, il sistema gestisce attivamente il proprio processo di ragionamento. Può riscrivere query che falliscono, scegliere metodi di recupero diversi e integrare più strumenti—come la ricerca vettoriale in Azure AI Search, database SQL o API personalizzate—prima di finalizzare la risposta. Questo elimina la necessità di framework di orchestrazione eccessivamente complessi. Invece, un ciclo relativamente semplice di “chiamata LLM → utilizzo strumento → chiamata LLM → …” può produrre output sofisticati e ben fondati.

Agentic RAG Core Loop

Gestire il Processo di Ragionamento

La qualità distintiva che rende un sistema “agentico” è la sua capacità di gestire autonomamente il proprio processo di ragionamento. Le implementazioni tradizionali di RAG spesso dipendono da percorsi predefiniti da parte degli esseri umani: una catena di pensieri che delinea cosa recuperare e quando. Ma quando un sistema è veramente agentico, decide internamente come affrontare il problema. Non sta solo eseguendo uno script; sta determinando autonomamente la sequenza di passaggi in base alla qualità delle informazioni che trova.

Ad esempio, se gli viene chiesto di creare una strategia di lancio di un prodotto, non si basa esclusivamente su un prompt che descrive l’intero flusso di lavoro di ricerca e decisione. Invece, il modello agentico decide autonomamente di:

  1. Recuperare rapporti sulle tendenze di mercato attuali utilizzando Bing Web Grounding.
  2. Identificare dati rilevanti sui concorrenti utilizzando Azure AI Search.
  3. Correlare metriche di vendita interne storiche utilizzando Azure SQL Database.
  4. Sintetizzare i risultati in una strategia coesa orchestrata tramite Azure OpenAI Service.
  5. Valutare la strategia per lacune o incoerenze, avviando un altro ciclo di recupero se necessario.

Tutti questi passaggi—perfezionare le query, scegliere le fonti, iterare fino a essere “soddisfatti” della risposta—sono decisi dal modello, non pre-scriptati da un essere umano.

Cicli Iterativi, Integrazione di Strumenti e Memoria

Tool Integration Architecture

Un sistema agentico si basa su un modello di interazione ciclica:

Nel tempo, questo crea una sensazione di comprensione evolutiva, permettendo al modello di navigare in compiti complessi e multi-step senza richiedere un intervento umano costante o la riformulazione del prompt.

Gestione dei Modi di Fallimento e Auto-Correzione

L’autonomia di Agentic RAG include anche meccanismi di auto-correzione robusti. Quando il sistema incontra vicoli ciechi—come il recupero di documenti irrilevanti o query malformate—può:

Questo approccio iterativo e dinamico consente al modello di migliorare continuamente, garantendo che non sia solo un sistema “one-shot”, ma uno che apprende dai suoi errori durante una sessione specifica.

Self Correction Mechanism

Limiti dell’Agenzia

Nonostante la sua autonomia all’interno di un compito, Agentic RAG non è analogo all’Intelligenza Artificiale Generale. Le sue capacità “agentiche” sono confinate agli strumenti, alle fonti di dati e alle politiche fornite dagli sviluppatori umani. Non può inventare i propri strumenti o superare i confini del dominio che sono stati impostati. Piuttosto, eccelle nell’orchestrare dinamicamente le risorse disponibili.

Le principali differenze rispetto a forme di IA più avanzate includono:

  1. Autonomia Specifica del Dominio: I sistemi Agentic RAG sono focalizzati sul raggiungimento di obiettivi definiti dall’utente all’interno di un dominio noto, impiegando strategie come la riscrittura delle query o la selezione degli strumenti per migliorare i risultati.
  2. Dipendenza dall’Infrastruttura: Le capacità del sistema dipendono dagli strumenti e dai dati integrati dagli sviluppatori. Non può superare questi confini senza intervento umano.
  3. Rispetto delle Regole di Sicurezza: Linee guida etiche, regole di conformità e politiche aziendali rimangono molto importanti. La libertà dell’agente è sempre vincolata da misure di sicurezza e meccanismi di supervisione (si spera?).

Casi d’Uso Pratici e Valore

Agentic RAG eccelle in scenari che richiedono perfezionamento iterativo e precisione:

  1. Ambienti Orientati alla Correttezza: In controlli di conformità, analisi normative o ricerca legale, il modello agentico può verificare ripetutamente i fatti, consultare più fonti e riscrivere query fino a produrre una risposta accuratamente verificata.
  2. Interazioni Complesse con Database: Quando si lavora con dati strutturati in cui le query potrebbero spesso fallire o necessitare di aggiustamenti, il sistema può perfezionare autonomamente le sue query utilizzando Azure SQL o Microsoft Fabric OneLake, garantendo che il recupero finale sia allineato con l’intento dell’utente.
  3. Flussi di Lavoro Estesi: Sessioni più lunghe potrebbero evolversi man mano che emergono nuove informazioni. Agentic RAG può incorporare continuamente nuovi dati, modificando le strategie mentre apprende di più sul problema.

Governance, Trasparenza e Fiducia

Man mano che questi sistemi diventano più autonomi nel loro ragionamento, la governance e la trasparenza sono cruciali:

Avere strumenti che forniscono un record chiaro delle azioni è essenziale. Senza di essi, il debug di un processo multi-step può essere molto difficile. Vedi il seguente esempio di Literal AI (azienda dietro Chainlit) per un Agent run:

AgentRunExample

Conclusione

Agentic RAG rappresenta un’evoluzione naturale nel modo in cui i sistemi di IA gestiscono compiti complessi e intensivi di dati. Adottando un modello di interazione ciclica, selezionando autonomamente strumenti e perfezionando query fino a raggiungere un risultato di alta qualità, il sistema va oltre il semplice seguire i prompt statici, diventando un decisore più adattivo e consapevole del contesto. Pur rimanendo vincolato alle infrastrutture e alle linee guida etiche definite dagli esseri umani, queste capacità agentiche consentono interazioni IA più ricche, dinamiche e, in definitiva, più utili per le imprese e gli utenti finali.

Hai altre domande su Agentic RAG?

Unisciti al Discord di Azure AI Foundry per incontrare altri studenti, partecipare a sessioni di domande e risposte e ottenere risposte alle tue domande sugli AI Agents.

Risorse Aggiuntive

Articoli Accademici

Lezione Precedente

Modello di progettazione per l’uso degli strumenti

Prossima Lezione

Costruire agenti AI affidabili


Disclaimer:
Questo documento è stato tradotto utilizzando il servizio di traduzione automatica Co-op Translator. Sebbene ci impegniamo per garantire l’accuratezza, si prega di notare che le traduzioni automatiche possono contenere errori o imprecisioni. Il documento originale nella sua lingua nativa dovrebbe essere considerato la fonte autorevole. Per informazioni critiche, si raccomanda una traduzione professionale effettuata da un traduttore umano. Non siamo responsabili per eventuali incomprensioni o interpretazioni errate derivanti dall’uso di questa traduzione.