Přeskočit navigaci

Optimalizace kampaní s využitím clusterů Azure HDInsight Spark

Toto řešení ukazuje, jak sestavit a nasadit model strojového učení s využitím Microsoft R Serveru v clusterech Azure HDInsight pro doporučování akcí vedoucích k maximalizaci nákupů potenciálních zákazníků, na které cílí kampaň. Toto řešení umožňuje efektivní zpracování velkých objemů dat ve Sparku s využitím Microsoft R Serveru.

Popis

Poznámka: Pokud jste toto řešení už nasadili, můžete ho zobrazit kliknutím sem.

Odhadovaný čas zřízení: 25 minut

Toto řešení vytvoří cluster HDInsight Spark s Microsoft R Serverem. Tento cluster bude obsahovat 2 hlavní uzly, 2 pracovní uzly, 1 hraniční uzel a celkem 32 jader. Přibližné náklady na tento cluster HDInsight Spark jsou $8.29/hod. Účtovat se začne při vytvoření clusteru a skončí se při jeho odstranění. Účtuje se poměrnou částí po minutách, takže byste cluster měli odstranit vždy, když už se nepoužívá. Jakmile budete hotovi, na stránce Deployments (Nasazení) odstraňte celé řešení.

Přehled

Když firmy spouštějí marketingové kampaně s cílem zaujmout zákazníky novými nebo stávajícími produkty, často používají sady obchodních pravidel pro výběr potenciálních zákazníků, na které bude jejich kampaň cílit. Ke zvýšení míry odezvy od těchto potenciálních zákazníků je možné využít strojové učení. Toto řešení ukazuje, jak využít model k předpovědi akcí, u kterých se očekává, že budou maximalizovat nákupy potenciálních zákazníků, na které cílí příslušná kampaň. Tyto předpovědi slouží jako základ doporučení, která se použijí v obnovené kampani, a to ohledně toho, jak (například pomocí e-mailu, SMS nebo telemarketingu) a kdy (den v týdnu a denní doba) kontaktovat cílové potenciální zákazníky. Předváděné řešení k modelování odezvy potenciálních zákazníků na kampaň využívá simulovaná data z oblasti pojišťovnictví. Prediktory modelu zahrnují demografické údaje o potenciálních zákaznících, výkon historických kampaní a podrobné informace o konkrétních produktech. Tento model předpovídá pravděpodobnost, že každý potenciální zákazník v databázi nakoupí prostřednictvím kanálu, a to každý den v týdnu v různou denní dobu. Doporučení týkající se kanálu, dne v týdnu a denní doby, které se mají použít při cílení na zákazníky, vycházejí z kombinace kanálu a času, u které model předpovídá největší pravděpodobnost nákupu.

Z obchodního pohledu

Toto řešení využívá strojové učení a historická data o kampaních k předvídání odezvy uživatelů a nabízení doporučení ohledně toho, kdy a jak se spojit s potenciálními zákazníky. Doporučení zahrnují nejlepší kanál pro kontaktování potencionálního zákazníka (v našem případě e-mail, SMS nebo telemarketing), nejlepší den v týdnu a nejlepší denní dobu, kdy se má kontakt uskutečnit.

Microsoft R Server v clusterech HDInsight Spark využívá kombinovaný výkon R Serveru a Apache Sparku a poskytuje tak možnosti distribuovaného a škálovatelného strojového učení pro velké objemy dat. Toto řešení ukazuje postup vývoje modelů strojového učení pro optimalizaci marketingových kampaní (včetně zpracování dat, vytváření funkcí, trénování a vyhodnocování modelů), nasazení modelů jako webové služby (na hraničním uzlu) a vzdálené používání této webové služby s využitím Microsoft R Serveru v clusterech Azure HDInsight Spark. Konečné předpovědi a tabulka doporučení se uloží do tabulky Hive, která obsahuje doporučení ohledně toho, jak a kdy kontaktovat jednotlivé potencionální zákazníky. Tato data se potom vizualizují v Power BI.

Power BI také prezentuje vizuální přehledy efektivity jednotlivých doporučení pro tuto kampaň (tady se zobrazují se simulovanými daty). Tento řídicí panel si můžete vyzkoušet kliknutím na tlačítko Try it Now (Vyzkoušet) na pravé straně.

Karta Recommendations (Doporučení) tohoto řídicího panelu zobrazuje předpovězená doporučení. V horní části je tabulka jednotlivých potenciálních zákazníků pro naše nové nasazení. Zahrnuje pole pro ID potenciálního zákazníka, kampaň a produkt, v kterých jsou uvedeni potenciální zákazníci, pro které se mají použít naše obchodní pravidla. Potom následují předpovědi modelu pro potenciální zákazníky, které uvádějí optimální kanál a čas pro jejich kontaktování, a odhad pravděpodobnosti, s jakou si potenciální zákazníci koupí náš produkt na základě těchto doporučení. Tyto pravděpodobnosti je možné využít ke zvýšení efektivity kampaně, a to omezením počtu kontaktovaných potenciálních zákazníků jenom na ty, u kterých je největší pravděpodobnost nákupu.

Karta Recommendations (Doporučení) obsahuje také různé souhrny doporučení a demografických informací o potenciálních zákaznících. Karta Campaign Summary (Souhrn kampaně) tohoto řídicího panelu zobrazuje souhrny historických dat použitých k vytvoření předpovězených doporučení. Tato karta sice také zobrazuje hodnoty pro den v týdnu, denní dobu a kanál, ale tyto hodnoty ve skutečnosti představují pozorování v minulosti. Nezaměňujte je s doporučeními z modelu zobrazenými na kartě Recommendations (Doporučení).

Z pohledu odborníka přes data

Toto řešení ukazuje kompletní proces vývoje a nasazení modelů strojového učení pro optimalizaci marketingových kampaní. Obsahuje ukázková data a kód R pro jednotlivé kroky sestavení modelu (včetně zpracování dat, vytváření funkcí, trénování a vyhodnocování modelů spolu s ukázkovými daty), nasazení modelu jako webové služby (na hraničním uzlu) a vzdáleného používání této webové služby s využitím Microsoft R Serveru v clusterech Azure HDInsight Spark.

Odborníci přes data, kteří testují toto řešení, můžou pracovat s poskytnutým kódem R v open source edici RStudio Serveru v prohlížeči, který běží na hraničním uzlu clusteru Azure HDInsight Spark. Prostřednictvím nastavení výpočetního kontextu se uživatel může rozhodnout, kde se budou provádět výpočty: místně na hraničním uzlu nebo distribuovaně napříč uzly v clusteru Spark. Veškerý kód R najdete také ve veřejném úložišti GitHub. Bavte se.

Právní omezení

© 2017 Microsoft Corporation. Všechna práva vyhrazena. Tyto informace se poskytují „tak, jak jsou“ a mohou se bez předchozího upozornění změnit. Společnost Microsoft neposkytuje s ohledem na uvedené informace žádné záruky, ať už výslovné, nebo implikované. K vytvoření řešení byla použita data třetích stran. Zodpovídáte za respektování práv ostatních, včetně pořízení náležitých licencí pro vytváření podobných datových sad a jejich dodržování.

Související architektury řešení

Optimalizace kampaně s využitím SQL Serveru

Toto řešení ukazuje, jak sestavit a nasadit model strojového učení s využitím SQL Serveru 2016 a R Services pro doporučování akcí vedoucích k maximalizaci nákupů potenciálních zákazníků, na které cílí kampaň.