Azure HDInsight Spark クラスターを使用したキャンペーンの最適化

このソリューションでは、Azure HDInsight Spark クラスターの Microsoft R Server を使用して、キャンペーン対象の潜在顧客の購入率を最大化するためのアクションを提案する機械学習モデルを構築してデプロイする方法を示します。このソリューションでは、Microsoft R Server を使用して Spark 上のビッグ データを効率的に処理します。

説明

注: このソリューションが既にデプロイされている場合は、ここをクリックしてそのデプロイを表示してください。

予測プロビジョニング時間: 25 分

このソリューションでは、Microsoft R Server を使用して HDInsight Spark クラスターを作成します。このクラスターには、2 つのヘッド ノード、2 つのワーカー ノード、1 つのエッジ ノードが含まれ、合計で 32 個のコアがあります。この HDInsight Spark クラスターの概算のコストは、1 時間あたり $8.29 です。課金は、クラスターが作成されると開始し、クラスターが削除されると終了します。課金は分単位で発生するため、使用しなくなったクラスターは随時削除することをお勧めします。終了したら、[デプロイ] ページでソリューション全体を削除してください。

概要

新製品や既存の製品に対して顧客に興味を持ってもらうために企業がマーケティング キャンペーンを立ち上げる際、多くの場合は、一連のビジネス ルールを使って、キャンペーン対象の潜在顧客を選別します。機械学習を使用すると、こうした潜在顧客からの応答率を高めることができます。このソリューションでは、モデルを使って、キャンペーン対象の潜在顧客の購入率を最大化すると期待されるアクションを予測する方法を具体的に示します。これらの予測は、再度新たにキャンペーンを実施するときに、ターゲットの潜在顧客に連絡をとる手段 (メール、SMS、勧誘の電話など)、および連絡をとるタイミング (曜日と時刻) を決定する際に使用する推奨事項のベースとなります。ここで示すソリューションでは、保険業界のシミュレーション データを使って、キャンペーンに対する潜在顧客の応答をモデル化します。モデル予測に用いられる材料には、潜在顧客の人口統計学的な詳細情報、過去のキャンペーン パフォーマンス、製品固有の詳細情報などがあります。モデルは、データベース内の各潜在顧客が各曜日の 1 日のさまざまな時刻にチャネルから購入する確率を予測します。その後、購入の確率が最も高くなるとモデルが予測するチャネルとタイミングの組み合わせに基づいて、ユーザーをターゲットするときに使用するチャネル、曜日、タイミングが提案されます。

ビジネスの視点

このソリューションは、キャンペーンの履歴データを活用する機械学習を使用して、顧客の反応を予測し、潜在顧客といつ、どのように連絡すればよいかを提案します。推奨事項には、潜在顧客に連絡する最適なチャネル (メール、SMS、勧誘の電話など)、連絡をとる最適な曜日と時刻が含まれています。

HDInsight Spark クラスターの Microsoft R Server では、R Server と Apache Spark の力を組み合わせて活用し、ビッグ データに対応した分散型かつスケーラブルな機械学習機能を提供しています。このソリューションでは、マーケティング キャンペーン最適化の機械学習モデルの開発方法 (データ処理、機能エンジニアリング、トレーニング、評価のモデルなどを含む)、Web サービスとしての機械学習モデルの (エッジ ノードでの) デプロイ方法、Azure HDInsight Spark クラスターの Microsoft R Server を使用したリモートでの Web サービスの使用方法を示します。潜在顧客にいつ、どのように連絡すればよいかの提案を含む最終的な予測と推奨事項のテーブルが、Hive テーブルに保存されます。その後、このデータは Power BI で視覚化されます。

Power BI では、キャンペーンの推奨事項の有効性についてのサマリーも視覚的に示されます (ここではシミュレーション データで示されます)。右側の [今すぐ試す] ボタンをクリックすると、このダッシュボードを試すことができます。

このダッシュボードの [推奨事項] タブには、予測された推奨事項が表示されます。最上部は、新しいデプロイの個別の潜在顧客のテーブルになっています。潜在顧客の ID、キャンペーン、製品のフィールドが含まれ、ビジネス ルールを適用する潜在顧客が設定されています。これに潜在顧客のモデル予測が続き、各潜在顧客に連絡する最適なチャネルと時刻が表示されます。さらに、これらの推奨事項を使用した潜在顧客が製品を購入する予測確率が表示されます。この確率を使って、連絡する潜在顧客の数を購買確率の高いサブセットに制限することで、キャンペーンの効率を高めることができます。

また、[推奨事項] タブには推奨事項のさまざまなサマリーと、潜在顧客に関する人口統計学情報も表示されます。ダッシュボードの [キャンペーン集計] タブには、予測推奨事項の作成に使われた履歴データのサマリーが表示されます。このタブには曜日、時刻、チャネルの値も表示されますが、これらの値は過去の実際の観測値です。[推奨事項] タブに表示されるモデルからの推奨事項と混同しないようにしてください。

データ サイエンティストの視点

このソリューションは、マーケティング キャンペーン最適化の機械学習モデルを開発してデプロイする方法を示すエンド ツー エンド プロセスを示します。このソリューションには、サンプル データや、モデル構築の各手順の R コードが含まれ (サンプル データと共にデータ処理、機能エンジニアリング、トレーニング、評価のモデルを含む)、Web サービスとしての機械学習モデルの (エッジ ノードでの) デプロイ方法、Azure HDInsight Spark クラスターの Microsoft R Server を使用したリモートでの Web サービスの使用方法を示します。

このソリューションをテストするデータ サイエンティストは、Azure HDInsight Spark クラスターの Edge Node 上で実行される RStudio Server のブラウザ ベース Open Source Edition で提供される R コードを使用できます。コンピューティング コンテキストを設定することにより、ユーザーはコンピューティングを実行する場所を決めることができ、エッジ ノード上でローカルに実行したり、Spark クラスター内のノードに配信したりすることができます。また、公開されている Github リポジトリですべての R コードを見つけることができます。ぜひお楽しみください。

免責事項

©2017 Microsoft Corporation.All rights reserved.本情報は "現状のまま" 提供され、通知なく変更されることがあります。Microsoft はここで提供される情報に関し、明示または暗示にかかわらず、いかなる保証も行わないものとします。ソリューションの生成にはサード パーティのデータが使用されています。お客様には他者の権利を尊重する責任があり、それには、類似のデータセットを作成するための関連ライセンスの購入や、そうした関連ライセンスへの準拠が含まれます。

関連ソリューションのアーキテクチャ

SQL Server によるキャンペーンの最適化

このソリューションでは、R Services 搭載の SQL Server 2016 を使用して、キャンペーンのターゲットとする潜在顧客の購入率を最大化するためのアクションを提案する機械学習モデルを構築して展開する方法を示します。