Trace Id is missing
Passa a contenuti principali
Azure

Che cos'è Recupero della generazione aumentata (RAG)?

Informazioni su come la tecnologia DIM (Retrieval-Augmented Generation) migliora l'accuratezza e la pertinenza delle risposte generate da modelli di linguaggio di grandi dimensioni.

RAG migliora l'accuratezza dell'intelligenza artificiale integrando le conoscenze esterne, garantendo risposte aggiornate e pertinenti

Migliorando le funzionalità di cloud computing e influenzando il progresso dell'intelligenza artificiale, RAG contribuisce a migliorare l'accuratezza e la pertinenza delle risposte generate dall'intelligenza artificiale, rendendo i sistemi di intelligenza artificiale più affidabili ed efficaci in varie applicazioni.

Risultati principali

  • La storia e l'evoluzione di RAG nell'intelligenza artificiale riflettono una tendenza più ampia verso sistemi più intelligenti e compatibili con il contesto che possono combinare in modo efficace grandi quantità di informazioni con funzionalità di generazione sofisticate.
  • L'architettura RAG consente ai sistemi di intelligenza artificiale di produrre contenuti più informati e affidabili basando la generazione con training preliminare nelle conoscenze esterne recuperate.
     
  • I vantaggi di RAG lo rendono una tecnica potente per la creazione di sistemi di intelligenza artificiale più accurati, affidabili e versatili, con applicazioni ampie in domini, settori e attività.
     
  • Gli sviluppatori usano RAG per creare sistemi di intelligenza artificiale in grado di generare contenuti basati su informazioni accurate, che consentono di ottenere applicazioni più affidabili, compatibili con il contesto e incentrate sull'utente.

  • I sistemi RAG combinano recupero e generazione, rendendolo uno strumento potente per un'ampia gamma di applicazioni, settori e casi d'uso.

  • A mano a mano che i modelli RAG continuano a avanzare, si prevede che svolgano un ruolo fondamentale in varie applicazioni, dal servizio clienti alla ricerca e alla creazione di contenuti.

  • RAG è impostato per svolgere un ruolo fondamentale nel futuro delle operazioni LLM, migliorando l'integrazione dei processi di recupero e generazione.

RAG: meccanismi, cronologia e impatto

Funzionamento di RAG

Recupero della generazione aumentata (RAG) è un framework di intelligenza artificiale che combina due tecniche; in primo luogo, recupera le informazioni pertinenti da origini esterne, ad esempio database, documenti o il Web. Una volta raccolte, queste informazioni vengono usate per informare e migliorare la generazione delle risposte. Questo approccio sfrutta i punti di forza delle tecniche di recupero e generazione, assicurandosi che le risposte siano accurate, pertinenti e contestualmente arricchite dalle informazioni più aggiornate e specifiche disponibili. Questa doppia funzionalità consente ai sistemi RAG di produrre output più informati e sfumati rispetto ai modelli puramente generativi.

Cronologia di RAG

RAG è basato sui primi sistemi di recupero delle informazioni di base. A mano a mano che si sviluppano tecnologie di intelligenza artificiale generative rapidamente avanzate e generative come GPT-2 e BERT, la necessità di risposte più accurate e pertinenti è aumentata.   Nel 2020 è stata introdotta l'architettura RAG, che segna un miglioramento significativo. L'uso di apprendimento automatico per combinare moduli di recupero e generatore che integrano le knowledge base interne di LLM con origini esterne di gruppi di disponibilità delle informazioni è stato in grado di produrre testo più accurato, aggiornato, coerente e contestualmente accurato.   Con Deep Learning di base, i modelli RAG possono essere sottoposti a training end-to-end, consentendo output che ottimizzano le risposte, migliorando la qualità del contenuto generato a mano a mano che il modello apprende a recuperare le informazioni più affidabili e contestualmente utili.

Importanza di RAG per l'intelligenza artificiale

RAG svolge un ruolo fondamentale nel far avanzare le funzionalità di intelligenza artificiale, riflettendo una tendenza verso sistemi più intelligenti e compatibili con il contesto che possono combinare in modo efficace grandi quantità di informazioni con funzionalità di generazione sofisticate. Ecco i motivi principali per cui RAG è fondamentale per l'intelligenza artificiale:

 
  • Accuratezza bilanciata: Grazie all'integrazione di origini di conoscenze esterne, RAG migliora significativamente l'accuratezza e la pertinenza delle risposte generate dai LLM.
  • Pertinenza contestuale: RAG consente ai sistemi di intelligenza artificiale di generare risposte più appropriate dal contesto recuperando informazioni specifiche correlate alla richiesta.

  • Efficienza a livello di costi: L'implementazione di RAG è più efficiente rispetto alla ripetizione dell'addestramento continua di LLM con nuovi dati. 

  • Trasparenza: Fornendo le origini per le informazioni usate nelle risposte, RAG migliora la attendibilità e la fiducia.
     
  • Versatilità: RAG può essere applicato in diversi settori, ad esempio settore sanitario, dell'istruzione e finanziario, e per scopi quali il servizio clienti, la ricerca e la creazione di contenuti.

  • Miglioramento dell'esperienza: Fornendo risposte più accurate e pertinenti, la tecnologia RAG consente interazioni più soddisfacenti e produttive per gli utenti.
 

Architettura RAG

L'architettura dei sistemi RAG è una combinazione di due moduli principali più un meccanismo di fusione che interagiscono per produrre output accurati e pertinenti a livello contestuale. I moduli RAG possono essere sottoposti a training end-to-end, consentendo all'algoritmo di ottimizzare il recupero e la generazione in collaborazione, ottenendo un risultato più informato e affidabile.

Ecco come funziona l'architettura RAG:

Il modulo retriever cerca in un set di dati di grandi dimensioni le informazioni più rilevanti in base alla query.

Dopo il recupero, il modulo generatore usa le informazioni recuperate come contesto aggiuntivo per generare una risposta coerente e pertinente. In genere, i moduli del generatore sono un modello linguistico con training preliminare, ad esempio un trasformatore generativo con training preliminare (GPT) o trasformatori bidirezionali e auto-regressivi (TRANSFORMER) ottimizzati per generare testo in base all'input e alle informazioni recuperate.

Il meccanismo fusion garantisce che le informazioni recuperate vengano effettivamente combinate nel processo generativo. Questa interazione tra i moduli consente ai sistemi RAG di produrre contenuto più informato e affidabile basando la generazione nelle conoscenze recuperate. 

Vantaggi di RAG

Architettura potente per migliorare l'intelligenza artificiale

Gli sviluppatori usano l'architettura RAG per creare sistemi di intelligenza artificiale più accurati, affidabili e versatili, con applicazioni ampie in diversi settori e attività. I vantaggi di RAG sono:
   
  • precisione, pertinenza e precisione contestuale migliorate: Recuperando i documenti o i dati pertinenti, RAG garantisce che l'output generato si basi su informazioni reali e pertinenti, migliorando l'accuratezza complessiva e la pertinenza delle risposte.

  • Riduzione delle allucinazioni tramite la generazione basata sui fatti: RAG riduce la probabilità che le allucinazioni generino informazioni comprensibili ma non corrette basando l'output del modello generativo sul contenuto recuperato effettivo, generando risultati più attendibili.

  • Prestazioni migliorate nelle attività open domain con ampio accesso alle conoscenze: RAG eccelle nella risposta alle domande in un dominio aperto e in attività simili recuperando in modo efficiente informazioni da origini vaste e diverse, consentendo di gestire un'ampia gamma di argomenti con profondità e ampiezza.

  • Scalabilità e capacità per gestire knowledge base di grandi dimensioni: RAG può cercare e recuperare in modo efficiente le informazioni rilevanti da set di dati di grandi dimensioni, rendendoli scalabili e adatti alle applicazioni che richiedono un ampio accesso alle conoscenze. I database NoSQL consentono ai modelli RAG di sfruttare grandi quantità di dati per generare risposte arricchite dal contesto.

  • Personalizzazione e applicazioni specifiche del dominio: I modelli RAG sono adattabili e possono essere ottimizzati per domini specifici, consentendo agli sviluppatori di creare sistemi di intelligenza artificiale specializzati su misura per determinati settori o attività, ad esempio consulenza legale, diagnostica medica o analisi finanziaria.

  • Apprendimento interattivo e adattivo: Grazie all'adattamento incentrato sull'utente, i sistemi RAG possono apprendere dalle interazioni degli utenti, recuperare informazioni più rilevanti nel tempo e adattare le risposte per soddisfare meglio le esigenze degli utenti, migliorando l'esperienza e l'engagement degli utenti.

  • Versatilità e integrazione multimodale: RAG può essere esteso per lavorare con dati multimodali (testo, immagini, dati strutturati), migliorando la ricchezza e la diversità delle informazioni usate nella generazione e ampliando le applicazioni del modello.

  • Scrittura informata per una creazione efficiente del contenuto: RAG offre uno strumento potente recuperando fatti e riferimenti pertinenti, garantendo che il contenuto generato non sia solo creativo, ma anche accurato e ben informato.

Tipi di sistemi RAG

Versatilità tra le applicazioni

Il recupero della generazione aumentata è un'architettura di intelligenza artificiale adattiva e versatile con un'ampia gamma di casi d'uso in domini e settori diversi. Ecco  applicazioni chiave di RAG:
 
  • ODQA (Open Domain Question Answering) 
    Caso d'uso:
    RAG è estremamente efficace nei sistemi ODQA, in cui gli utenti possono porre domande praticamente su qualsiasi argomento.
    Esempio: Le chatbot di supporto clienti usano RAG per fornire risposte accurate recuperando informazioni da knowledge base o domande frequenti di grandi dimensioni.

  • Query specializzate specifiche del dominio 
    Caso d'uso:
    Per il settore legale, RAG può contribuire all'analisi e alla generazione di riepiloghi di casi legali, precedenti e leggi recuperando i documenti pertinenti.
    Esempio: Uno strumento assistente legale recupera e riepiloga i documenti per scopi specifici.

  • Riepilogo del contenuto
    Caso d'uso:
    RAG consente di generare contenuto di alta qualità, ad esempio le note della riunione dell'assistente virtuale o riepiloghi di articoli, report o post di blog, recuperando informazioni rilevanti e integrandolo nel testo generato.
    Esempio: Un operatore usa RAG per generare riepiloghi degli articoli di notizie recenti recuperando i dettagli principali da varie fonti.

  • Consigli personalizzati
    Caso d'uso:
    RAG può migliorare i sistemi di raccomandazione recuperando informazioni specifiche dell'utente e generando suggerimenti personalizzati.
    Esempio: Una piattaforma di e-commerce usa RAG per consigliare i prodotti in base alla cronologia di esplorazione e alle preferenze di un utente, offrendo spiegazioni generate da recensioni o descrizioni dei prodotti pertinenti.

  • Analisi di scenari complessi e creazione di contenuto 
    Caso d'uso:
    Un modello RAG ibrido può essere usato per generare e sintetizzare report dettagliati o analisi recuperando dati, documenti o notizie rilevanti da più origini complesse.
    Esempio: Uno strumento di analisi finanziaria genera proiezioni di investimento, analisi o report recuperando e riepilogando le tendenze di mercato recenti, i dati finanziari cronologici, le prestazioni azionarie, il commento degli esperti e gli indicatori economici.

  • Informazioni e sintesi di ricerca
    Caso d'uso:
    I ricercatori possono usare RAG per recuperare e sintetizzare informazioni da documenti accademici, report o database, facilitando revisioni e progetti di ricerca.
    Esempio: Uno strumento accademico genera riepiloghi dei documenti di ricerca pertinenti recuperando i risultati chiave di vari studi.

  • Applicazioni multilingua e interlingua
    Caso d'uso:
    RAG può essere distribuito in ambienti multilingue per recuperare informazioni in lingue diverse e generare contenuto multilingue.
    Esempio: Uno strumento di traduzione traduce il testo, recuperando al tempo stesso informazioni rilevanti a livello culturale per garantire che la traduzione sia appropriata a livello contestuale.

RAG potenzia l'intelligenza artificiale di domani

Aumentare la precisione nell'output di intelligenza artificiale

Recupero della generazione aumentata è impostato per svolgere un ruolo fondamentale nel futuro delle operazioni LLM, migliorando l'integrazione dei processi di recupero e generazione. I miglioramenti previsti in quest'area consentiranno una fusione più semplice e sofisticata di questi componenti, consentendo ai LLM di fornire output estremamente accurati e contestualmente pertinenti in una gamma più ampia di applicazioni e settori.

A mano a mano che RAG continua a evolversi, è possibile anticiparne l'adozione in nuovi domini, ad esempio l'istruzione personalizzata, in cui può personalizzare le esperienze di apprendimento in base alle esigenze individuali e strumenti di ricerca avanzati, offrendo un recupero delle informazioni preciso e completo per richieste complesse.

La risoluzione delle limitazioni correnti, ad esempio il miglioramento dell'accuratezza del recupero e la riduzione delle distorsioni, sarà fondamentale per ottimizzare il potenziale dei sistemi RAG. È probabile che le iterazioni future di RAG presentino sistemi più interattivi e compatibili con il contesto, migliorando le esperienze utente adattandosi dinamicamente agli input degli utenti.

Inoltre, lo sviluppo di modelli RAG multimodali, che usano visione artificiale per integrare testo, immagini e altri tipi di dati, si espanderà e aprirà ancora più possibilità, rendendo i LLM più versatili e potenti che mai.
DOMANDE FREQUENTI

Domande frequenti

  • Il recupero della generazione aumentata è una tecnica di intelligenza artificiale che combina un modello di recupero con un modello generativo. Recupera le informazioni correlate da un database o un set di documenti e le usa per generare risposte più accurate e contestualmente pertinenti. Questo approccio migliora la qualità del testo generato dall'intelligenza artificiale inserendolo in dati reali, rendendolo particolarmente utile per attività come la risposta alle domande, il riepilogo e la creazione di contenuto.
  • RAG migliora il contenuto generato dall'intelligenza artificiale incorporando dati esterni. Recupera le informazioni pertinenti da un database e quindi usa tali dati per generare risposte più accurate e compatibili con il contesto. Questo processo garantisce che l'output del sistema di intelligenza artificiale sia più informato e più affidabile.
  • RAG combina un modello LLM (Large Language Model) con un meccanismo di recupero. Anche se un LLM genera testo basato su dati con training preliminare, RAG migliora questa funzionalità recuperando in tempo reale le informazioni rilevanti da origini esterne, migliorando l'accuratezza e la pertinenza. Essenzialmente, LLM si basa su modelli appresi, mentre RAG esegue attivamente il pull di informazioni aggiornate per informarne le risposte.