Kampagnenoptimierung mit Azure HDInsight Spark-Clustern

Diese Lösung veranschaulicht, wie Sie ein Machine Learning-Modell mit Microsoft R Server in Azure HDInsight Spark-Clustern erstellen und bereitstellen, um Maßnahmen zur Maximierung der Abschlussquote bei Leads zu empfehlen, die Zielgruppe einer Kampagne sind. Die Lösung ermöglicht eine effiziente Verarbeitung von Big Data in Spark mit Microsoft R Server.

Beschreibung

Hinweis: Wenn Sie diese Lösung bereits bereitgestellt haben, klicken Sie hier, um sich Ihre Bereitstellung anzeigen zu lassen.

Geschätzte Bereitstellungszeit: 25 Minuten

Diese Lösung erstellt einen HDInsight Spark-Cluster mit Microsoft R Server. Dieser Cluster umfasst zwei Hauptknoten, zwei Workerknoten und einen Edgeknoten mit insgesamt 32 Kernen. Die Kosten für diesen HDInsight Spark-Cluster betragen ca. $8.29/Stunde. Die Abrechnung beginnt, sobald ein Cluster erstellt wird, und endet, wenn der Cluster gelöscht wird. Die Abrechnung erfolgt anteilig pro Minute. Daher sollten Sie Cluster immer löschen, wenn sie nicht mehr verwendet werden. Auf der Seite „Bereitstellungen“ können Sie die gesamte Lösung löschen, sobald Sie fertig sind.

Übersicht

Wenn ein Unternehmen eine Marketingkampagne startet, um Kunden für neue oder bereits vorhandene Produkte zu begeistern, werden häufig Geschäftsregeln verwendet, um bestimmte Leads als Zielgruppe der Kampagne auszuwählen. Machine Learning kann dazu beitragen, die Rücklaufquote für diese Leads zu erhöhen. Die vorliegende Lösung veranschaulicht, wie mithilfe eines Modells Maßnahmen prognostiziert werden, die mit einer gewissen Wahrscheinlichkeit zur Maximierung der Abschlussquote für Leads führen, die Zielgruppe der Kampagne sind. Diese Prognosen dienen als Grundlage für Empfehlungen, die im Rahmen einer Wiederholungskampagne verwendet werden sollen. Diese Empfehlungen geben an, wie die Kontaktaufnahme mit den anzusprechenden Leads erfolgen soll (beispielsweise per E-Mail, SMS oder Kaltakquise) und wann der beste Zeitpunkt für die Kontaktaufnahme ist (Wochentag, Uhrzeit). Die hier gezeigte Lösung verwendet Simulationsdaten aus der Versicherungsbranche, um die Reaktionen der Leads auf die Kampagne zu modellieren. Zu den Modellprädiktoren gehören demografische Angaben zu den Leads, Informationen zum Verlauf früherer Kampagnen sowie produktspezifische Details. Das Modell prognostiziert für jeden Kanal, jeden Wochentag und verschiedene Uhrzeiten die Wahrscheinlichkeit für einen Kauf durch einen Lead. Die Empfehlungen dafür, über welchen Kanal, an welchem Wochentag und zu welcher Tageszeit die jeweiligen Benutzer kontaktiert werden sollten, basieren dann auf derjenigen Kombination aus Kanal und Wochentag/Uhrzeit, die nach Prognose des Modells die höchste Wahrscheinlichkeit für einen Kauf aufweist.

Geschäftliche Perspektive

Diese Lösung nutzt Machine Learning-Verfahren, um anhand von Daten zum Kampagnenverlauf Kundenreaktionen zu prognostizieren und Empfehlungen zu bieten, wann und auf welche Weise Sie Ihre Leads kontaktieren sollten. Die Empfehlungen umfassen den besten Kanal (in unserem Beispiel E-Mail, SMS oder Kaltakquise), den besten Wochentag und die geeignetste Tageszeit für die Kontaktaufnahme.

Microsoft R Server in HDInsight Spark-Clustern bietet verteilte und skalierbare Machine Learning-Funktionen für Big Data und nutzt die kombinierte Leistungsstärke von R Server und Apache Spark. Diese Lösung veranschaulicht die Entwicklung von Machine Learning-Modellen für die Optimierung von Marketingkampagnen (einschließlich Modellen für Datenverarbeitung, Funktionsentwicklung, Training und Auswertung), die Bereitstellung der Modelle als Webdienst (auf dem Edgeknoten) und die Nutzung des Webdiensts per Remotezugriff mit Microsoft R Server in Azure HDInsight Spark-Clustern. Die endgültigen Prognosen und Empfehlungen werden in einer Hive-Tabelle gespeichert, die Empfehlungen dazu enthält, wann und wie die Kontaktaufnahme mit jedem einzelnen Lead erfolgen sollte. Diese Daten werden dann in Power BI visuell aufbereitet.

Power BI zeigt außerdem eine visuelle Übersicht über die Wirksamkeit der Kampagnenempfehlungen (hier anhand von Simulationsdaten gezeigt). Klicken Sie auf die Schaltfläche „Jetzt ausprobieren“ auf der rechten Seite, um dieses Dashboard auszuprobieren.

Die Registerkarte „Empfehlungen“ des Dashboards zeigt die prognostizierten Empfehlungen. Ganz oben befindet sich eine Tabelle mit den einzelnen Leads für unsere neue Bereitstellung. Diese enthält Felder für die Lead-ID, die Kampagne und das Produkt. Diese sind mit Leads aufgefüllt, auf die unsere Geschäftsregeln angewendet werden sollen. Darauf folgen die Modellprognosen für die Leads, die den optimalen Kanal und Zeitpunkt für die jeweilige Kontaktaufnahme angeben, sowie die anhand dieser Empfehlungen geschätzten Wahrscheinlichkeiten dafür, dass die Leads unser Produkt kaufen werden. Mithilfe dieser Wahrscheinlichkeiten kann die Effizienz der Kampagne gesteigert werden, indem nur die Leads mit der höchsten Kaufwahrscheinlichkeit kontaktiert werden.

Auf der Registerkarte „Empfehlungen“ finden Sie auch verschiedene Übersichten mit Empfehlungen und demografischen Daten zu den Leads. Die Registerkarte mit der Zusammenfassung der Kampagne zeigt eine Übersicht über die Verlaufsdaten, die zum Erstellen der prognostizierten Empfehlungen verwendet wurden. Diese Registerkarte zeigt auch Werte für Wochentag, Uhrzeit und Kanal an, diese beziehen sich jedoch auf vergangene Beobachtungen und dürfen nicht mit den Empfehlungen aus dem Modell verwechselt werden, die auf der Registerkarte „Empfehlungen“ zu sehen sind.

Data Scientist-Perspektive

Diese Lösung veranschaulicht den vollständigen Prozess der Entwicklung und Bereitstellung von Machine Learning-Modellen zur Optimierung von Marketingkampagnen. Sie enthält Beispieldaten und R-Code für jeden Schritt: Erstellung des Modells (einschließlich Modellen für Datenverarbeitung, Funktionsentwicklung, Training und Auswertung sowie Beispieldaten), Bereitstellung des Modells als Webdienst (auf dem Edgeknoten) und Nutzung des Webdiensts per Remotezugriff mit Microsoft R Server in Azure HDInsight Spark-Clustern.

Data Scientists, die diese Lösung testen, können mit dem bereitgestellten R-Code aus der browserbasierten Open Source-Edition von RStudio Server arbeiten, die auf dem Edgeknoten des Azure HDInsight Spark-Clusters ausgeführt wird. Durch Einrichten des Computekontexts kann der Benutzer entscheiden, wo die Berechnung ausgeführt wird: lokal auf dem Edgeknoten oder verteilt auf den Knoten im Spark-Cluster. Der gesamte R-Code findet sich auch im öffentlichen GitHub-Repository. Viel Spaß!

Haftungsausschluss

©2017 Microsoft Corporation. Alle Rechte vorbehalten. Alle Informationen werden im vorliegenden Zustand bereitgestellt und können sich ohne Vorankündigung ändern. Microsoft leistet weder ausdrücklich noch stillschweigend Gewähr hinsichtlich der hier zur Verfügung gestellten Informationen. Zur Erstellung der Lösung wurden Drittanbieterdaten verwendet. Sie sind dafür verantwortlich, die Rechte Dritter zu berücksichtigen. Hierzu zählen u.a. das Beschaffen relevanter Lizenzen, die zur Erstellung ähnlicher Datensätze benötigt werden, und das Erfüllen der jeweiligen Lizenzbedingungen.

Zugehörige Lösungsarchitekturen

Kampagnenoptimierung mit SQL Server

Mit dieser Lösung wird veranschaulicht, wie Sie ein Machine Learning-Modell mit SQL Server 2016 mit R Services erstellen und bereitstellen, um Maßnahmen zur Maximierung der Abschlussquote bei Leads zu empfehlen, die Zielgruppe einer Kampagne sind.