Previsione della cancellazione dei prestiti con cluster Azure HDInsight Spark

Un prestito cancellato è un prestito per cui un creditore, in genere un istituto di credito, dichiara che è probabile che una quantità del debito non verrà recuperata, in genere quando il pagamento del prestito presenta uno in stato di grave morosità da parte del debitore. Poiché un livello elevato di cancellazioni ha un impatto negativo sulla chiusura finanziaria di fine anno degli istituti di credito, il rischio di cancellazione dei prestiti viene spesso monitorato con grande attenzione dagli istituti di credito, in modo da evitare che si verifichino cancellazioni. L'uso di Azure HDInsight R Server consente agli istituti di credito di sfruttare i vantaggi delle analisi predittive di Machine Learning per prevedere la probabilità di cancellazione dei prestiti e creare un report relativo ai risultati delle analisi archiviati in tabelle HDFS e Hive.

Descrizione

Nota: se hai già distribuito questa soluzione, fai clic qui per visualizzare la distribuzione.

Tempo stimato per il provisioning: 25 minuti

Questa soluzione crea un cluster HDInsight Spark con Microsoft R Server. Il cluster conterrà 2 nodi head, 2 nodi di lavoro e 1 nodo perimetrale con un totale di 32 core. Il costo approssimativo per questo cluster HDInsight Spark è $8.29/ora. La fatturazione inizia nel momento in cui si crea un cluster e si interrompe quando il cluster viene eliminato. La fatturazione è ripartita in base ai minuti, quindi è sempre consigliabile eliminare il cluster quando non lo usi più. Usa la pagina Distribuzione per eliminare l'intera soluzione al termine delle operazioni.

Panoramica

I dati di previsione delle cancellazioni offrono molti vantaggi agli istituti di credito. La cancellazione di un prestito è l'ultima soluzione che verrà adottata dalla banca per un prestito in stato di grave morosità. Con i dati previsionali in mano, il responsabile del credito potrà offrire incentivi personalizzati, ad esempio un tasso di interesse più basso o una scadenza più estesa per consentire ai clienti di rimborsare il prestito e scongiurarne la cancellazione. Per ottenere questo tipo di dati previsionali, spesso le banche e gli istituti di credito assemblano manualmente i dati in base allo storico dei pagamenti dei clienti ed eseguono semplici analisi di regressione statistica. Questo metodo è soggetto a errori di compilazione dei dati e non è basato sulla statistica.

Questo modello di soluzione mostra una soluzione completa per l'esecuzione di analisi predittive sui dati dei crediti e assegna un punteggio per la probabilità di cancellazione. Il report di Power BI visualizzerà inoltre l'analisi e la tendenza dei prestiti, nonché le previsioni relative alle probabilità di cancellazione.

Punto di vista aziendale

Questa previsione sulla cancellazione dei prestiti usa dati storici simulati per prevedere la probabilità di cancellazione dei prestiti nell'immediato futuro (tre mesi successivi). Maggiore è il punteggio, maggiore è la probabilità di cancellazione dei prestiti nel futuro.

Insieme ai dati di analisi, al gestore del credito vengono fornite anche le tendenze e le analisi dei prestiti cancellati per succursale. Le caratteristiche dei prestiti con rischio cancellazione elevato consentiranno ai gestori del credito di redigere un business plan per le offerte di credito in quell'area geografica specifica.

Microsoft R Server nei cluster HDInsight Spark offre funzionalità di Machine Learning distribuite e scalabili per Big Data, sfruttando i vantaggi delle capacità combinate di R Server e Apache Spark. Questa soluzione illustra come sviluppare modelli di Machine Learning per la previsione dei prestiti con rischio cancellazione (inclusi elaborazione dei dati, progettazione di funzionalità, training e valutazione dei modelli), come distribuire i modelli come servizio Web (nel nodo perimetrale) e utilizzare in modalità remota il servizio Web con Microsoft R Server nei cluster Azure HDInsight Spark. Le previsioni finali vengono salvate in una tabella Hive che può essere visualizzata in Power BI.

Power BI presenta anche riepiloghi visivi dei pagamenti del prestito e delle previsioni del rischio di cancellazione, mostrati qui con dati simulati. È possibile provare questo dashboard facendo clic sul collegamento "Prova adesso".

Punto di vista dei data scientist

Questo modello di soluzione illustra in modo dettagliato il processo end-to-end per lo sviluppo di analisi predittive tramite un set di dati cronologici simulati sui prestiti per prevedere il rischio di cancellazione dei prestiti. I dati contengono informazioni come dati demografici dei titolari dei prestiti, ammontare dei prestiti, durata contrattuale dei prestiti e cronologia dei pagamenti dei prestiti. Il modello di soluzione include anche un set di script R che eseguono l'elaborazione dei dati e la progettazione di funzionalità e alcuni algoritmi diversi per il training dei dati e infine selezionano il modello con le prestazioni migliori per assegnare punteggi ai dati per produrre un punteggio di probabilità per ogni prestito. La soluzione include anche script per la distribuzione del modello come servizio Web nel nodo perimetrale e per l'utilizzo del servizio Web in modalità remota con Microsoft R Server in cluster Azure HDInsight Spark.

I data scientist che eseguono test di questa soluzione possono usare il codice R fornito dall'edizione open source basata su browser di R Studio Server eseguita sul nodo perimetrale del cluster Azure HDInsight Spark. Configurando il contesto di calcolo l'utente può decidere dove verranno eseguiti i calcoli, ovvero localmente nel nodo perimetrale o distribuiti nei diversi nodi nel cluster Spark. Tutto il codice R può essere trovato anche nel repository pubblico di GitHub. Buon divertimento.

Dichiarazione di non responsabilità

©2017 Microsoft Corporation. Tutti i diritti sono riservati. Queste informazioni vengono fornite "così come sono" e sono soggette a modifiche senza preavviso. Microsoft non fornisce alcuna garanzia, espressa o implicita, in merito alle informazioni fornite qui. Per la generazione della soluzione sono stati usati dati di terze parti. La responsabilità per il rispetto dei diritti di altri, inclusi l'acquisizione e la conformità delle licenze rilevanti per la creazione di set di dati simili, è a tuo carico.

Architetture delle soluzioni correlate

Previsione di cancellazione del prestito con SQL Server

Questa soluzione mostra come compilare e distribuire un modello di Machine Learning con SQL Server 2016 e R Services per prevedere se sarà necessario cancellare un prestito bancario entro i prossimi 3 mesi

Rischio di credito su prestiti con SQL Server

Con SQL Server 2016 e R Services, un istituto di credito può avvalersi dell'analisi predittiva per ridurre il numero di prestiti offerti ai richiedenti che non saranno in grado di ripagarlo, aumentando così la redditività del portfolio di prestiti.