Che cos'è Recupero della generazione aumentata (RAG)?

Informazioni su come la tecnologia DIM (Retrieval-Augmented Generation) migliora l'accuratezza e la pertinenza delle risposte generate da modelli di linguaggio di grandi dimensioni.

Crea app intelligenti Introduzione ad Azure

Definizione di Retrieval-Augmented Generation (RAG)

La generazione aumentata del recupero è un framework di intelligenza artificiale che prevede il recupero di informazioni rilevanti da origini esterne per informare e migliorare la generazione delle risposte. Questa doppia funzionalità consente ai sistemi RAG di produrre output più informati e sfumati rispetto ai modelli puramente generativi.

Risultati principali

L'architettura RAG consente ai sistemi di intelligenza artificiale di produrre contenuti più informati e affidabili basando la generazione con training preliminare nelle conoscenze esterne recuperate.

I vantaggi di RAG lo rendono una tecnica potente per la creazione di sistemi di intelligenza artificiale più accurati, affidabili e versatili, con applicazioni ampie in domini, settori e attività.

Gli sviluppatori usano RAG per creare sistemi di intelligenza artificiale in grado di generare contenuti basati su informazioni accurate, che consentono di ottenere applicazioni più affidabili, compatibili con il contesto e incentrate sull'utente.

I sistemi RAG combinano recupero e generazione, rendendolo uno strumento potente per un'ampia gamma di applicazioni, settori e casi d'uso.

A mano a mano che i modelli RAG continuano a avanzare, si prevede che svolgano un ruolo fondamentale in varie applicazioni, dal servizio clienti alla ricerca e alla creazione di contenuti.

RAG è impostato per svolgere un ruolo fondamentale nel futuro delle operazioni LLM, migliorando l'integrazione dei processi di recupero e generazione.

RAG: come funziona e perché è importante

Funzionamento di RAG

La generazione con recupero incrementato combina due tecniche. In primo luogo, recupera informazioni da origini quali database, documenti o il Web. Una volta raccolte, queste informazioni vengono usate per informare la generazione delle risposte. Questo approccio sfrutta i punti di forza delle tecniche di recupero e generazione, assicurandosi che le risposte siano accurate, pertinenti e contestualmente arricchite dalle informazioni più aggiornate e specifiche disponibili.

Importanza di RAG per l'intelligenza artificiale

RAG svolge un ruolo fondamentale nel far avanzare le funzionalità di intelligenza artificiale, riflettendo una tendenza verso sistemi più intelligenti e compatibili con il contesto che possono combinare in modo efficace grandi quantità di informazioni con funzionalità di generazione sofisticate. Ecco i motivi principali per cui RAG è fondamentale per l'intelligenza artificiale:

Accuratezza migliorata: Grazie all'integrazione di origini di conoscenze esterne, RAG migliora significativamente l'accuratezza e la pertinenza delle risposte generate dai LLM.

Rilevanza contestuale: RAG consente ai sistemi di intelligenza artificiale di generare risposte più appropriate dal contesto recuperando informazioni specifiche correlate alla richiesta.
Efficienza dei costi: L'implementazione di RAG è più efficiente rispetto alla ripetizione dell'addestramento continua di LLM con nuovi dati.
Trasparenza:Fornendo le origini per le informazioni usate nelle risposte, RAG migliora la attendibilità e la fiducia.
Versatilità: RAG può essere applicato in diversi settori, ad esempio settore sanitario, dell'istruzione e finanziario, e per scopi quali il servizio clienti, la ricerca e la creazione di contenuti.
Esperienza migliorata: Fornendo risposte più accurate e pertinenti, la tecnologia RAG consente interazioni più soddisfacenti e produttive per gli utenti.

Architettura RAG

L'architettura dei sistemi RAG è una combinazione di due moduli principali più un meccanismo di fusione che interagiscono per produrre output accurati e pertinenti a livello contestuale. I moduli RAG possono essere sottoposti a training end-to-end, consentendo all'algoritmo di ottimizzare il recupero e la generazione in collaborazione, ottenendo un risultato più informato e affidabile.

Ecco come funziona l'architettura RAG:

Il modulo retriever cerca in un set di dati di grandi dimensioni le informazioni più rilevanti in base alla query.

Dopo il recupero, il modulo generatore usa le informazioni recuperate come contesto aggiuntivo per generare una risposta coerente e pertinente. In genere, i moduli del generatore sono un modello linguistico con training preliminare, ad esempio un trasformatore generativo con training preliminare (GPT) o trasformatori bidirezionali e auto-regressivi (TRANSFORMER) ottimizzati per generare testo in base all'input e alle informazioni recuperate.

Il meccanismo fusion garantisce che le informazioni recuperate vengano effettivamente combinate nel processo generativo. Questa interazione tra i moduli consente ai sistemi RAG di produrre contenuto più informato e affidabile basando la generazione nelle conoscenze recuperate.

Quali sono i vantaggi dell'infrastruttura RAG?

Architettura potente per migliorare l'intelligenza artificiale

Gli sviluppatori usano l'architettura RAG per creare sistemi di intelligenza artificiale più accurati, affidabili e versatili, con applicazioni ampie in diversi settori e attività. I vantaggi di RAG sono:

Maggiore accuratezza, pertinenza e precisione contestuale: Recuperando i documenti o i dati pertinenti, RAG garantisce che l'output generato si basi su informazioni reali e pertinenti, migliorando l'accuratezza complessiva e la pertinenza delle risposte.
Riduzione delle allucinazioni grazie alla generazione basata sui fatti: RAG riduce la probabilità che le allucinazioni generino informazioni comprensibili ma non corrette basando l'output del modello generativo sul contenuto recuperato effettivo, generando risultati più attendibili.
Prestazioni migliorate nelle attività open-domain con accesso a un ampio patrimonio di conoscenze: RAG eccelle nella risposta alle domande in un dominio aperto e in attività simili recuperando in modo efficiente informazioni da origini vaste e diverse, consentendo di gestire un'ampia gamma di argomenti con profondità e ampiezza.
Scalabilità e capacità per gestire knowledge base di grandi dimensioni: RAG può cercare e recuperare in modo efficiente informazioni rilevanti da set di dati di grandi dimensioni, rendendoli scalabili e adatti per le applicazioni che richiedono un accesso completo alle conoscenze. I database NoSQL consentono ai modelli RAG di sfruttare grandi quantità di dati per generare risposte arricchite dal contesto.
Personalizzazione e applicazioni specifiche per dominio: I modelli RAG sono adattabili e possono essere ottimizzati per domini specifici, consentendo agli sviluppatori di creare sistemi di intelligenza artificiale specializzati su misura per determinati settori o attività, ad esempio consulenza legale, diagnostica medica o analisi finanziaria.
Personalizzazione e applicazioni specifiche per dominio: Grazie all'adattamento incentrato sull'utente, i sistemi RAG possono apprendere dalle interazioni degli utenti, recuperare informazioni più rilevanti nel tempo e adattare le risposte per soddisfare meglio le esigenze degli utenti, migliorando l'esperienza e l'engagement degli utenti.
Versatilità e integrazione multimodale: RAG può essere esteso per lavorare con dati multimodali (testo, immagini, dati strutturati), migliorando la ricchezza e la diversità delle informazioni usate nella generazione e ampliando le applicazioni del modello.
Scrittura informata per una creazione di contenuti efficiente: RAG offre uno strumento potente recuperando fatti e riferimenti pertinenti, garantendo che il contenuto generato non sia solo creativo, ma anche accurato e ben informato.

Quali sono le applicazioni RAG più comuni?

Versatilità tra le applicazioni

Il recupero della generazione aumentata è un'architettura di intelligenza artificiale adattiva e versatile con un'ampia gamma di casi d'uso in domini e settori diversi. Ecco alcune applicazioni chiave di RAG:

ODQA (Open Domain Question Answering)
Caso d'uso: RAG è estremamente efficace nei sistemi ODQA, in cui gli utenti possono porre domande praticamente su qualsiasi argomento.
Esempio: Le chatbot di supporto clienti usano RAG per fornire risposte accurate recuperando informazioni da knowledge base o domande frequenti di grandi dimensioni.
Query specializzate specifiche del dominio
Caso d'uso: Per il settore legale, RAG può contribuire all'analisi e alla generazione di riepiloghi di casi legali, precedenti e leggi recuperando i documenti pertinenti.
Esempio: Uno strumento assistente legale recupera e riepiloga i documenti per scopi specifici.
Riepilogo del contenuto
Caso d'uso: RAG consente di generare contenuto di alta qualità, ad esempio le note della riunione dell'assistente virtuale o riepiloghi di articoli, report o post di blog, recuperando informazioni rilevanti e integrandolo nel testo generato.
Esempio: Un operatore usa RAG per generare riepiloghi degli articoli di notizie recenti recuperando i dettagli principali da varie fonti.
Consigli personalizzati
Caso d'uso: RAG può migliorare i sistemi di raccomandazione recuperando informazioni specifiche dell'utente e generando suggerimenti personalizzati.
Esempio: Una piattaforma di e-commerce usa RAG per consigliare i prodotti in base alla cronologia di esplorazione e alle preferenze di un utente, offrendo spiegazioni generate da recensioni o descrizioni dei prodotti pertinenti.
Analisi di scenari complessi e creazione di contenuto
Caso d'uso: Un modello RAG ibrido può essere usato per generare e sintetizzare report dettagliati o analisi recuperando dati, documenti o notizie rilevanti da più origini complesse.
Esempio: Uno strumento di analisi finanziaria genera proiezioni di investimento, analisi o report recuperando e riepilogando le tendenze di mercato recenti, i dati finanziari cronologici, le prestazioni azionarie, il commento degli esperti e gli indicatori economici.
Informazioni e sintesi di ricerca
Caso d'uso: I ricercatori possono usare RAG per recuperare e sintetizzare informazioni da documenti accademici, report o database, facilitando revisioni e progetti di ricerca.
Esempio: Uno strumento accademico genera riepiloghi dei documenti di ricerca pertinenti recuperando i risultati chiave di vari studi.
Applicazioni multilingua e interlingua
Caso d'uso: RAG può essere distribuito in ambienti multilingue per recuperare informazioni in lingue diverse e generare contenuto multilingue.
Esempio: Uno strumento di traduzione traduce il testo, recuperando al tempo stesso informazioni rilevanti a livello culturale per garantire che la traduzione sia appropriata a livello contestuale.

RAG potenzia l'intelligenza artificiale di domani

Aumentare la precisione nell'output di intelligenza artificiale

Recupero della generazione aumentata è impostato per svolgere un ruolo fondamentale nel futuro delle operazioni LLM, migliorando l'integrazione dei processi di recupero e generazione. I miglioramenti previsti in quest'area consentiranno una fusione più semplice e sofisticata di questi componenti, consentendo ai LLM di fornire output estremamente accurati e contestualmente pertinenti in una gamma più ampia di applicazioni e settori.

A mano a mano che RAG continua a evolversi, è possibile anticiparne l'adozione in nuovi domini, ad esempio l'istruzione personalizzata, in cui può personalizzare le esperienze di apprendimento in base alle esigenze individuali e strumenti di ricerca avanzati, offrendo un recupero delle informazioni preciso e completo per richieste complesse.

La risoluzione delle limitazioni correnti, ad esempio il miglioramento dell'accuratezza del recupero e la riduzione delle distorsioni, sarà fondamentale per ottimizzare il potenziale dei sistemi RAG. È probabile che le iterazioni future di RAG presentino sistemi più interattivi e compatibili con il contesto, migliorando le esperienze utente adattandosi dinamicamente agli input degli utenti.

Inoltre, lo sviluppo di modelli RAG multimodali, che usano visione artificiale per integrare testo, immagini e altri tipi di dati, si espanderà e aprirà ancora più possibilità, rendendo i LLM più versatili e potenti che mai.

RISORSE 

Crea con Servizi di Azure AI

Inizia

Donna con occhiali e una sciarpa che sorride mentre lavora su un portatile in un ambiente all'aperto, in una ambiente tropicale.

Risorse di Azure

Visita il centro risorse di Azure

Guarda i video sulle procedure, visualizza white paper e report degli analisti, esplora formazione ed eventi e ottieni case study, esempi di codice e architetture di soluzioni.

Scopri Azure

Una persona a una scrivania con più monitor che visualizzano il codice, che lavora su un portatile in un ambiente di ufficio.

Microsoft Learn

Esplora l'hub di apprendimento IA

Sviluppa le tue competenze di intelligenza artificiale con esercitazioni autogestite, eventi di formazione virtuale e corsi di persona progettati per il tuo ruolo specifico.

Inizia a imparare

Due persone stanno parlando di qualcosa su uno schermo, con una che tiene in mano un tablet che visualizza informazioni.

Studenti sviluppatori

Avvia la tua carriera nel settore tecnologico

Ottieni di più con strumenti e programmi esclusivi per gli studenti. Ottieni l'accesso a video, esercitazioni, strumenti gratuiti e programmi della community.

Esplora le risorse degli studenti

DOMANDE FREQUENTI

Il recupero della generazione aumentata è una tecnica di intelligenza artificiale che combina un modello di recupero con un modello generativo. Recupera le informazioni correlate da un database o un set di documenti e le usa per generare risposte più accurate e contestualmente pertinenti. Questo approccio migliora la qualità del testo generato dall'intelligenza artificiale inserendolo in dati reali, rendendolo particolarmente utile per attività come la risposta alle domande, il riepilogo e la creazione di contenuto.
RAG migliora il contenuto generato dall'intelligenza artificiale incorporando dati esterni. Recupera le informazioni pertinenti da un database e quindi usa tali dati per generare risposte più accurate e compatibili con il contesto. Questo processo garantisce che l'output del sistema di intelligenza artificiale sia più informato e più affidabile.
RAG combina un modello LLM (Large Language Model) con un meccanismo di recupero. Anche se un LLM genera testo basato su dati con training preliminare, RAG migliora questa funzionalità recuperando in tempo reale le informazioni rilevanti da origini esterne, migliorando l'accuratezza e la pertinenza. Essenzialmente, LLM si basa su modelli appresi, mentre RAG esegue attivamente il pull di informazioni aggiornate per informarne le risposte.

Esplora il portale di Azure