Hopp over navigasjon

Kampanjeoptimalisering med Azure HDInsight Spark-klynger

Denne løsningen demonstrerer hvordan du bygger og distribuerer en maskinlæringsmodell med Microsoft R Server på Azure HDInsight Spark-klynger med R Services for å anbefale tiltak for å maksimalisere kjøp av potensielle kunder som en kampanje er rettet mot. Denne løsningen muliggjør effektiv behandling av store data på Spark med Microsoft R Server.

Beskrivelse

Merk: Hvis du allerede har distribuert denne løsningen, kan du klikke her for å vise distribusjonen.

Estimert klargjøringstid: 25 minutter

Denne løsningen vil opprette en HDInsight Spark-klynge med Microsoft R Server. Denne klyngen vil inneholde to hovednoder, to arbeidsnoder og én kantnode med totalt 32 kjerner. Den omtrentlige kostnaden for denne HDInsight Spark-klyngen er $8.29/time. Faktureringen starter så snart en klynge er opprettet, og stopper når klyngen slettes. Fakturering er fordelt per minutt, så du bør alltid slette klyngen når den ikke lenger er i bruk. Bruk distribusjoner-siden for å slette hele løsningen når du er ferdig.

Oversikt

Når en bedrift lanserer en markedsføringskampanje for å interessere kunder i nye eller eksisterende produkter, bruker de ofte et sett med forretningsregler for å velge ut de potensielle kundene som kampanjen skal rettes mot. Maskinlæring kan brukes for å hjelpe med å øke svarprosenten fra disse potensielle kundene. Denne løsningen demonstrerer hvordan du bruker en modell for å forutse handlinger som forventes å maksimalisere kjøp fra potensielle kunder som kampanjen rettes mot. Disse forutsigelsene fungerer som et grunnlag for anbefalinger som kan brukes av en fornyet kampanje om hvordan kontakt skal opprettes (for eksempel e-post, SMS eller telefon) og når en skal ta kontakt (ukedag og klokkeslett) med de potensielle kundene. Løsningen som presenteres her bruker simulerte data fra forsikringsbransjen for å bygge en modell over svar fra potensielle kunder i kampanjen. Modellvariablene inkluderer demografiske detaljer om de potensielle kundene, historisk kampanjeytelse og produktspesifikke detaljer. Modellen forutser sannsynligheten for at hver av de potensielle kundene foretar et kjøp fra en kanal, på hver av ukedagene, ved forskjellige tidspunkt. Anbefalinger om hvilken kanal, ukedag og hvilket klokkeslett som skal brukes ved kundekontakt er basert på kombinasjonen av kanalen og tiden som modellen forutser vil ha den høyeste sannsynligheten for at et kjøp vil finne sted.

Forretningsperspektiv

Løsingen benytter maskinlæring som bruker historiske data for å forutse kunderesponser og anbefaler når og hvordan du skal ta kontakt med potensiale kunder. Anbefalinger inkluderer de beste kanalene for å ta kontakt med en potensiell kunde (i vårt eksempel e-post, SMS eller telefon), og den beste ukedagen og beste tid på dagen for når kontakten skal opprettes.

Microsoft R Server på HDInsight Spark-klynger tilbyr distribuerte og skalerbare maskinlæringsegenskaper for store data ved å kombinere kraften til R Server og Apache Spark. Denne løsningen demonstrerer hvordan du utvikler maskinlæremodeller for optimalisering av markedsføringskampanjer (inkludert databehandling, funksjonsutvikling, opplæring og evaluering av modeller), distribuer modellene som en nettjeneste (på kantnoden) og bruk nettjenesten eksternt med Microsoft R Server på Azure HDInsight Spark-klynger. Tabellen for endelige prognoser og anbefalinger lagres til en Hive-tabell som inneholder anbefalinger for hvordan og nå du skal ta kontakt med hver potensielle kunde. Disse dataene blir så visualisert i PowerBI.

PowerBI presenterer også visuelle sammendrag over effektivetaten til kampanjens anbefalinger (vist her med simulerte data). Du kan prøve dette dashbordet ved å klikke på knappen Prøv nå til høyre.

Anbefalinger-fanen på dette dashbordet viser de forutsagte anbefalingene. På toppen finner du en tabell over individuelle potensielle kunder for ny utvikling. Dette inkluderer felt for potensiell kunde-ID, kampanje og produkt, som er fylt med informasjon om hvilke forretningsregler som skal brukes. Dette etterfølges av modellforutsigelser for de potensielle kundene som gir den optimale kanalen og tiden for å kontakte hver av dem, i sammen med de estimerte sannsynlighetene for at de potensielle kundene kommer til å kjøpe produktet vårt etter at disse anbefalingene er benyttet. Disse sannsynlighetene kan brukes for å øke effektiviteten til kampanjen ved å begrense antallet potensielle kunder som skal kontaktes basert på underkategorien mest sannsynlig å kjøpe.

Anbefalinger-fanen gir også forskjellige sammendrag av anbefalinger og demografisk informasjon om de potensielle kundene. Kampanjesammendrag-fanen på dashbordet viser sammendrag over historiske data som brukes for å opprette de forutsagte anbefalingene. Mens denne fanen også viser verdier for ukedag, tidspunkt og kanal, er disse verdiene faktiske tidligere observasjoner som ikke må forvirres med anbefalingene fra modellen, vist i Anbefalinger-fanen.

Perspektivet til dataforskere

Denne løsningen demonstrerer den fullstendige prosessen for hvordan du utvikler og distribuerer maskinlæringsmodeller for optimalisering av markedsføringskampanjer. Den inkluderer eksempeldata, R-kode for hvert trinn av oppbygningen av modellen (inkludert databehandling, funksjonsutvikling, opplæring og evaluering av modeller samt eksempeldata), distribuering av modellene som en nettjeneste (på kantnoden) og bruk av nettjenesten eksternt med Microsoft R Server på Azure HDInsight Spark-klynger.

Dataforskere som tester denne løsningen kan jobbe med den medleverte R-koden fra den nettleserbaserte åpen kilde-utgaven av RStudio Server som kjøper på kantnoden til Azure HDInsight Spark-klyngen. Ved å angi databehandlingskontekst kan brukeren avgjøre hvor databehandlingen vil bli utført: lokalt på kantnoden eller distribuert på tvers av nodene i Spark-klyngen. All R-koden kan også finnes i det offentlige GitHub-arkivet. Lykke til!

Ansvarsfraskrivelse

©2017 Microsoft Corporation. Med enerett. Denne informasjonen gis «som den er» og kan endres uten varsel. Microsoft gir ingen garantier, uttrykkelig eller underforstått, i forbindelse med informasjonen som oppgis her. Tredjepartsdata ble benyttet for å generere løsningen. Du er ansvarlig for å respektere andres rettigheter, inkludert anskaffelse og overhold av relevante lisenser for å opprette lignende datasett.

Relaterte løsningsarkitekturer

Kampanjeoptimalisering med SQL Server

Denne løsningen demonstrerer hvordan du bygger og distribuerer en maskinlæringsmodell med SQL Server 2016 med R Services for å anbefale tiltak for å maksimalisere kjøp av potensielle kunder som en kampanje er rettet mot.