Ignora esplorazione

Ottimizzazione della campagna con cluster Azure HDInsight Spark

Questa soluzione illustra come creare e distribuire un modello di Machine Learning con Microsoft R Server nei cluster Azure HDInsight Spark per consigliare azioni per massimizzare il tasso di acquisto dei lead interessati da una campagna. Questa soluzione consente la gestione efficiente di Big Data su Spark con Microsoft R Server.

Descrizione

Nota: se hai già distribuito questa soluzione, fai clic qui per visualizzare la distribuzione.

Tempo stimato per il provisioning: 25 minuti

Questa soluzione crea un cluster HDInsight Spark con Microsoft R Server. Il cluster conterrà 2 nodi head, 2 nodi di lavoro e 1 nodo perimetrale con un totale di 32 core. Il costo approssimativo per questo cluster HDInsight Spark è $8.29/ora. La fatturazione inizia nel momento in cui si crea un cluster e si interrompe quando il cluster viene eliminato. La fatturazione è ripartita in base ai minuti, quindi è sempre consigliabile eliminare il cluster quando non lo usi più. Usa la pagina Distribuzione per eliminare l'intera soluzione al termine delle operazioni.

Panoramica

Quando un business lancia una campagna di marketing per suscitare l'interesse dei clienti in prodotti nuovi o esistenti, usa spesso un set di regole di business per selezionare lead che devono essere i destinatari della campagna. Machine Learning può essere usato per incrementare la percentuale di risposta da questi lead. Questa soluzione illustra come usare un modello per prevedere azioni che dovrebbero massimizzeranno il tasso di acquisto dei lead interessati dalla campagna. Queste previsioni vengono usate come base per i consigli che devono essere usati da una campagna rinnovata su come contattare i lead (ad esempio, posta elettronica, SMS o telefonata diretta) e quando contattare i lead interessati. La soluzione presentata qui usa dati simulati del settore assicurativo per modellare le risposte dei lead alla campagna. I predittori del modello includono dettagli demografici dei lead, prestazioni cronologiche della campagna e dettagli specifici del prodotto. Il modello prevede la probabilità che ogni lead nel database effettui un acquisto da un canale, in ogni giorno della settimana a diversi orari nella giornata. I consigli sul canale, sul giorno della settimana e sull'orario della giornata da usare per contattare gli utenti sono basati sulla combinazione di canale e orario che secondo la previsione del modello avrà la probabilità più elevata di un acquisto effettivo.

Punto di vista aziendale

Questa soluzione usa il Machine Learning basato sui dati cronologici della campagna per prevedere le risposte dei clienti e consigliare quando e come contattare i lead. I consigli includono il canale migliore per contattare un lead (nel nostro esempio posta elettronica, SMS o telefonata diretta), il giorno migliore della settimana e l'orario migliore della giornata per il contatto.

Microsoft R Server nei cluster HDInsight Spark offre funzionalità di Machine Learning distribuite e scalabili per Big Data, sfruttando i vantaggi delle capacità combinate di R Server e Apache Spark. Questa soluzione illustra come sviluppare modelli di Machine Learning per l'ottimizzazione della campagna di marketing (inclusi elaborazione dei dati, progettazione di funzionalità, training e valutazione dei modelli), come distribuire i modelli come servizio Web (nel nodo perimetrale) e utilizzare in modalità remota il servizio Web con Microsoft R Server nei cluster Azure HDInsight Spark. Le previsioni finali e la tabella dei consigli vengono salvate in una tabella Hive che contiene consigli su come e quando contattare ogni lead. Questi dati vengono quindi visualizzati in Power BI.

Power BI presenta anche riepiloghi visivi dell'efficacia dei consigli della campagna, mostrati qui con dati simulati. È possibile provare questo dashboard facendo clic sul pulsante Prova subito a destra.

La scheda Consigli di questo dashboard mostra i consigli previsti. Nella parte superiore è disponibile una tabella dei singoli lead per la nuova distribuzione. La tabella include i campi per ID lead, campagna e prodotto, popolati con i lead a cui devono essere applicate le regole aziendali. Di seguito sono disponibili le previsioni del modello per i lead, che indicano il canale e l'orario ottimale per contattare ogni lead, unitamente alle probabilità stimate dell'acquisto del nostro prodotto da parte dei lead tramite questi consigli. Queste probabilità possono essere usate per migliorare l'efficienza della campagna limitando il numero di lead contattati al sottoinsieme con maggiore probabilità di acquisto.

Nella scheda Consigli sono disponibili anche diversi riepiloghi dei consigli e informazioni demografiche sui lead. La scheda Riepilogo campagna del dashboard mostra riepiloghi dei dati cronologici usati per creare i consigli previsti. Anche se questa scheda mostri anche i valori per giorno della settimana, ora del giorno e canale, tali valori sono osservazioni passate reali, da non confondere con i consigli del modello, illustrati nella scheda Consigli.

Punto di vista dei data scientist

Questa soluzione illustra il processo end-to-end relativo a come sviluppare e distribuire modelli di Machine Learning per l'ottimizzazione di campagne di marketing. Contiene dati di esempio, codice R per ogni passaggio della creazione del modello (inclusi elaborazione dei dati, progettazione di funzionalità, training e valutazione dei modelli, unitamente a dati di esempio), della distribuzione del modello come servizio Web (nel nodo perimetrale) e di utilizzo in modalità remota del servizio Web con Microsoft R Server nei cluster Azure HDInsight Spark.

I data scientist che eseguono test di questa soluzione possono usare il codice R fornito dall'edizione open source basata su browser di R Studio Server eseguita sul nodo perimetrale del cluster Azure HDInsight Spark. Configurando il contesto di calcolo l'utente può decidere dove verranno eseguiti i calcoli, ovvero localmente nel nodo perimetrale o distribuiti nei diversi nodi nel cluster Spark. Tutto il codice R può essere trovato anche nel repository pubblico di GitHub. Buon divertimento.

Dichiarazione di non responsabilità

©2017 Microsoft Corporation. Tutti i diritti sono riservati. Queste informazioni vengono fornite "così come sono" e sono soggette a modifiche senza preavviso. Microsoft non fornisce alcuna garanzia, espressa o implicita, in merito alle informazioni fornite qui. Per la generazione della soluzione sono stati usati dati di terze parti. La responsabilità per il rispetto dei diritti di altri, inclusi l'acquisizione e la conformità delle licenze rilevanti per la creazione di set di dati simili, è a tuo carico.

Architetture delle soluzioni correlate

Ottimizzazione della campagna con SQL Server

Questa soluzione illustra come creare e distribuire un modello di Machine Learning con SQL Server 2016 con R Services per consigliare azioni per massimizzare il tasso di acquisto dei lead interessati da una campagna.