Campagne-optimalisatie met Azure HDInsight Spark Clusters

Deze oplossing laat u zien hoe u een machine learning-model kunt bouwen en implementeren met Microsoft R Server on Azure HDInsight Spark-clusters om acties aan te bevelen waardoor de aankoopactiviteiten van leads die tijdens een campagne zijn gegenereerd, worden gemaximaliseerd. Dankzij deze oplossing kunt u big data in Spark met Microsoft R Server efficiënt verwerken.

Beschrijving

Opmerking: als u deze oplossing al hebt geïmplementeerd, klikt u hier om de implementatie te bekijken.

Geschatte inrichtingstijd: 25 minuten

Deze oplossing maakt een HDInsight Spark-cluster met Microsoft R Server. Dit cluster bevat twee hoofdknooppunten, twee werkknooppunten en één edge-knooppunt met in totaal 32 kerngeheugens. De geschatte kosten voor dit HDInsight Spark-cluster zijn $8.29/uur. De facturering begint zodra een cluster is gemaakt en stopt als een cluster wordt verwijderd. De facturering wordt pro-rato per minuut berekend, dus u moet altijd uw cluster verwijderen wanneer het niet meer wordt gebruikt. Gebruik de pagina Implementaties om de complete oplossing te verwijderen wanneer u klaar bent.

Overzicht

Wanneer een bedrijf een marketingcampagne lanceert om de interesse van klanten in nieuwe of bestaande producten te wekken, gebruiken ze vaak een reeks bedrijfsregels om leads te selecteren waar ze hun campagne op richten. Machine learning kan worden gebruikt om het aantal reacties van deze leads te verhogen. Deze oplossing laat zien hoe u een model kunt gebruiken om acties te voorspellen die naar verwachting de aankoopcijfers van leads waarop de campagne is gericht zullen maximaliseren. Deze voorspellingen dienen als basis voor aanbevelingen die moeten worden gebruikt bij een nieuwe campagne over de manier waarop (bijv. e-mail, sms of cold calls) en wanneer (dag en tijdstip) contact moet worden opgenomen met de beoogde leads. In de oplossing die hier wordt getoond worden gesimuleerde gegevens uit de verzekeringsbranche gebruikt om modelreacties van de leads op de campagne weer te geven. De voorspellingsfactoren van het model omvatten demografische details van de leads, historische campagneprestaties en productspecifieke informatie. Het model voorspelt de kans dat elke lead in de database een aankoop via een bepaald kanaal doet, op elke dag van de week op verschillende tijdstippen. Aanbevelingen over de te gebruiken kanalen, dagen en tijdstippen bij het zoeken van gebruikers worden vervolgens gebaseerd op de combinatie van kanaal en contactmoment die volgens de voorspelling van het model de hoogste kans heeft op een aankoop.

Vanuit het perspectief van een bedrijf

Deze oplossing maakt gebruik van machine learning en benut daarbij historische campagnegegevens om reacties van klanten te voorspellen en te adviseren wanneer en hoe u contact kunt opnemen met uw leads. Tot de aanbevelingen behoren het beste kanaal om contact met leads op te nemen (in ons voorbeeld is dat e-mail, sms of cold calls) en de beste dag van de week en het beste moment op de dag waarop contact kan worden opgenomen.

Microsoft R Server in HDInsight Spark-clusters levert gedistribueerde en schaalbare machine learning-mogelijkheden voor big data door optimaal gebruik te maken van de gecombineerde kracht van R Server en Apache Spark. Deze oplossing demonstreert hoe machine learning-modellen kunnen worden ontwikkeld voor optimalisaties van marketingcampagnes (inclusief gegevensverwerking, feature-engineering, modellen trainen en evalueren), de modellen te implementeren als een webservice (op het edge-knooppunt) en de webservice op afstand te gebruiken met Microsoft R Server op Azure HDInsight Spark-clusters. De uiteindelijke voorspellingen en de aanbevelingentabel worden opgeslagen in een Hive-tabel met daarin aanbevelingen met betrekking tot hoe en wanneer u het beste contact kunt opnemen met elke lead. Deze gegevens worden vervolgens gevisualiseerd in Power BI.

Power BI geeft bovendien visuele samenvattingen van de effectiviteit van de aanbevelingen voor de campagne (wordt hier getoond met gesimuleerde gegevens). U kunt dit dashboard nu uitproberen door te klikken op de knop Nu uitproberen rechts.

Op het tabblad Aanbevelingen van dit dashboard staan de voorspelde aanbevelingen. Bovenaan ziet u een tabel met afzonderlijke leads voor onze nieuwe implementatie. Hierin staan velden voor de id van de lead, de campagne en het product, ingevuld met leads waarop onze bedrijfsregels moeten worden toegepast. Hierna staan de modelvoorspellingen voor de leads, met daarbij het optimale kanaal en de optimale tijd om contact op te nemen met elke lead, samen met de geschatte kansen dat de leads ons product zullen kopen aan de hand van deze aanbevelingen. Deze kansen kunnen worden gebruikt om de efficiëntie van de campagne te verbeteren door het aantal leads waarmee contact wordt opgenomen te beperken naar de subset met leads die ons product het meest waarschijnlijk zullen kopen.

Op het tabblad Aanbevelingen staan verder verschillende samenvattingen van aanbevelingen en demografische informatie over de leads. Op het tabblad Campagnesamenvatting op het dashboard staan samenvattingen van de historische gegevens die zijn gebruikt om de voorspelde aanbevelingen te maken. Hoewel op dit tabblad ook waarden staan bij Dag van de week, Tijdstip van de dag en Kanaal, zijn deze waarden observaties uit het verleden die niet moeten worden verward met de aanbevelingen uit het model die op het tabblad Aanbevelingen staan.

Vanuit het perspectief van de datawetenschapper

Deze oplossing demonstreert het complete proces van hoe machine learning-modellen voor optimalisatie van marketingcampagnes kunnen worden ontwikkeld en geïmplementeerd. Ze bevat voorbeeldgegevens, R-code voor elke stap van het bouwen van het model (inclusief gegevensverwerking, feature-engineering, modellen trainen en evalueren samen met voorbeeldgegevens), de modellen te implementeren als een webservice (op het edge-knooppunt) en de webservice op afstand gebruiken met Microsoft R Server op Azure HDInsight Spark-clusters.

Gegevenswetenschappers die deze oplossing testen, kunnen werken met de bijgeleverde R-code van de op browser gebaseerde Open Source Edition van RStudio Server die uitvoert op het Edge-knooppunt van het Azure HDInsight Spark-cluster. Door de rekencontext in te stellen, kan de gebruiker beslissen waar de berekening wordt uitgevoerd: lokaal op het edge-knooppunt, of gedistribueerd op de knooppunten in het Spark-cluster. Alle R-code is ook te vinden in de openbare Github-opslagplaats. Veel plezier.

Vrijwaring

© 2017 Microsoft Corporation. Alle rechten voorbehouden. Deze informatie wordt als zodanig geleverd en kan zonder kennisgeving worden gewijzigd. Microsoft biedt geen garanties, expliciet of impliciet, met betrekking tot de hier verstrekte informatie. Gegevens van derden zijn gebruikt om de oplossing te genereren. U bent verantwoordelijk voor het respecteren van de rechten van anderen, inclusief het aanschaffen en naleven van relevante licenties om vergelijkbare gegevenssets te maken.

Gerelateerde architecturen voor oplossingen

Optimalisatie van campagnes met SQL Server

Deze oplossing laat u zien hoe u een machine learning-model kunt bouwen en implementeren met SQL Server 2016 met R Services om acties aan te bevelen waardoor de aankoopactiviteiten van leads die tijdens een campagne zijn gegenereerd, worden gemaximaliseerd.