Kampányoptimalizálás Azure HDInsight Spark-fürtökkel

Ez a megoldás azt mutatja be, hogy miként hozhat létre és helyezhet üzembe egy gépi tanulási modellt az Azure HDInsight Spark-fürtön futtatott Microsoft R Server használatával olyan ajánlások elkészítése céljából, amelyek révén maximalizálhatja a vásárlók arányát egy adott kampány célközönségként kijelölt érdeklődői körében. Ez a megoldás lehetővé teszi a big data jellegű adatok hatékony kezelését a Microsoft R Servert futtató Spark-fürtökön.

Leírás

Megjegyzés: ha már üzembe helyezte ezt a megoldást, az üzemelő példányt ide kattintva érheti el.

Üzembe helyezés becsült ideje: 25 perc

Ez a megoldás létrehoz egy Microsoft R Servert futtató HDInisght Spark-fürtöt, amely két főcsomópontot, két feldolgozócsomópontot, egy határcsomópontot és összesen 32 processzormagot tartalmaz. A HDInsight Spark-fürt hozzávetőleges költsége $8.29/óra. A díjakat a fürt létrehozásától a fürt törléséig tartó időszakra számítjuk fel, percalapú elszámolással, tehát a fürtöt mindig törölje, ha az már nincs használatban. Ha befejezte a munkát, a Deployments (Üzemelő példányok) lapon törölheti a teljes megoldást.

Áttekintés

Amikor a vállalkozások az új vagy meglévő termékeik iránti érdeklődés felkeltése céljából marketingkampányt indítanak, gyakran üzleti szabályok segítségével választják ki a kampánnyal megcélozni kívánt érdeklődőket. A gépi tanulás segítségével növelhető az érdeklődők válaszaránya. Ez a megoldás azt mutatja be, hogy egy modell segítségével miként lehet meghatározni zokat a tevkenységeket, amelyek várhatóan maximalizálni fogják a kampány célközönségeként kijelölt érdeklődők vásárlási arányát. Ezek az előrejelzések egy megújított kampányban alapul szolgálnak a megcélzott érdeklődőkkel való kapcsolatfelvétel módjára (például e-mail, SMS vagy telemarketing) és időpontjára (a hét egy adott napja és a nap egy adott órája) vonatkozó ajánlások elkészítéséhez. Az itt bemutatott megoldás szimulált biztosítási adatokkal modellezi az érdeklődők reagálását a kampányra. A modell előrejelzői között megtalálhatók az érdeklődők demográfiai adatai, a korábbi kampányok teljesítménymutatói, valamint a termékspecifikus adatok. A modell azt számítja ki, hogy az adatbázisban szereplő érdeklődők milyen valószínűség vásárolnak valamit a különböző megkeresési csatornákon, a hét egyes napjain és óráiban. A modell annak alapján készíti el ajánlását a felhasználók célközönségként történő kiválasztására leginkább alkalmas csatornára és időpontra vonatkozóan, hogy mely csatorna–időpont kombináció esetén a legnagyobb a vásárlás valószínűsége.

Üzleti szempontok

Ez a megoldás a korábbi kampányok adatait hasznosító gépi tanulás segítségével határozza meg az ügyfelek várható reakcióit, és ajánlásokat készít az érdeklődőkkel való kapcsolatfelvétel idejére és módjára vonatkozóan. Az ajánlások javaslatot tesznek arra, hogy milyen módszerrel (a példánkban e-mailben, SMS-ben vagy telemarketinggel), a hét melyik napján és a nap melyik órájában érdemes megkeresni a potenciális ügyfelet.

A HDInsight Spark-fürtökön futó Microsoft R Server az R Server és az Apache Spark hatékonyságát ötvözve kínál elosztott és skálázható gépi tanulási funkciókat big data-jellegű adatok elemzéséhez. Ez a megoldás a marketingkampányok optimalizására szolgáló gépi tanulási (például adatfeldolgozási, „feature engineering”, betanítási és kiértékelési) modellek létrehozását, a modellek webszolgáltatásként való üzembe helyezését (a határcsomóponton) és a webszolgáltatás Azure HDInsight Spark-fürtökön futó Microsoft R Serverrel történő távoli használatát szemlélteti. A megoldás a végső előrejelzéseket és az ajánlást tartalmazó táblát egy Hive-táblába menti, amely ajánlásokat tartalmaz az egyes érdeklődőkkel való kapcsolatfelvétel módjára és időpontjára vonatkozóan. Ezután a vizualizált adatok megjelennek a Power BI-ban.

A Power BI vizuális összegzéseket készít a kampányra vonatkozó ajánlások hatékonyságáról is (a példában szimulált adatok szerepelnek). Ha szeretné kipróbálni az irányítópultot, kattintson a jobb oldalon található Kipróbálás gombra.

Az irányítópult Recommendations (Ajánlások) lapján találhatók az előrejelzések alapján készült ajánlások. Legfelül egy táblázatban láthatók az újonnan üzembe helyezett megoldás egyes érdeklődői. Az itt található mezőkben azon érdeklődők adatai (érdeklődő azonosítója, kampány, termék) szerepelnek, akikre alkalmazni szeretnénk az üzleti szabályokat. Ezeket az adatokat a modell által készített érdeklődői előrejelzések követik, megadva a kapcsolatfelvétel optimális módját és időpontját, valamint azt, hogy az adott ügyfél mekkora valószínűséggel fogja megvásárolni termékünket. E valószínűségi adatok révén hatékonyabbá tehető a kampány, mert a megszólított érdeklődők száma a legvalószínűbb vásárlók körére szűkíthető.

A Recommendations lapon ezenfelül az ajánlások különböző összegzései, valamint az érdeklődők demográfiai adatai is megtekinthetők. Az irányítópult Campaign Summary (Kampányösszegzés) lapján az előrejelzések alapján készült ajánlások létrehozásához felhasznált előzményadatok összegzései láthatók. Ezen a lapon is szerepelnek olyan értékek, amelyek a kapcsolatfelvétel időpontjára és módjára vonatkoznak, de ezek a tényleges múltbeli megfigyelések értékei, amelyek nem tévesztendők össze a Recommendations lapon megjelenő ajánlásokkal.

Adatszakértői szempontok

Ez a megoldás a gépi tanulási modellek marketingkampány-optimalizálás céljából történő létrehozásának és üzembe helyezésének teljes folyamatát szemlélteti. A mintaadatok mellett tartalmazza a modellkészítés (beleértve az adatfeldolgozási, „feature engineering”, betanítási és kiértékelési modelleket) egyes lépéseinek R-kódját, és a modellt webszolgáltatásként helyezi üzembe (a határcsomóponton), amelynek távoli használatát az Azure HDInsight Spark-fürtökön futó Microsoft R Server biztosítja.

A megoldást tesztelő adatszakértők az R-kódot az Azure HDInsight Spark-fürt határcsomópontján futó RStudio Server böngészőalapú nyílt forráskódú kiadásában tekinthetik meg. A számítási környezet beállításával a felhasználó eldöntheti, hogy a számítási műveletek helyileg, a határcsomóponton, vagy a Spark-fürt csomópontjain elosztva legyenek-e végrehajtva. A teljes R-kód megtalálható a Github nyilvános kódtárában is. Jó tesztelést!

Jogi nyilatkozat

© 2017 Microsoft Corporation. Minden jog fenntartva. Ezt az információt jelen formájában nyújtjuk, és előzetes értesítés nélkül változhat. Az itt szereplő információkra a Microsoft nem vállal sem kifejezett, sem vélelmezett garanciát. A megoldás harmadik féltől származó adatok felhasználásával lett létrehozva. Ön felelős mások jogainak tiszteletben tartásáért, beleértve a hasonló adatkészletek létrehozásának céljából történő beszerzéseket és a vonatkozó licenceknek való megfelelőséget is.

Kapcsolódó megoldásarchitektúrák

Kampányoptimalizálás az SQL Server segítségével

Ez a megoldás bemutatja, hogyan lehet létrehozni és üzembe helyezni egy gépi tanulási modellt az SQL Server 2016 with R Services segítségével, és felhasználni azt a kampányok által megcélzott potenciális ügyfelek vásárlási arányának maximalizálását célzó tevékenységek ajánlására.