Azure HDInsight Spark 클러스터를 사용한 캠페인 최적화

이 솔루션은 Azure HDInsight Spark 클러스터에서 Microsoft R Server를 통해 기계 학습 모델을 빌드 및 배포하여 캠페인에서 대상으로 지정된 잠재 고객의 구매 비율을 최대화할 수 있는 작업을 추천하는 방법을 보여 줍니다. 이 솔루션을 통해 Microsoft R Server에서 Spark의 빅 데이터를 효율적으로 처리할 수 있습니다.

설명

참고: 이 솔루션을 이미 배포한 경우 여기를 클릭하여 배포를 확인하세요.

예상 프로비전 시간: 25분

이 솔루션은 Microsoft R Server를 사용하여 HDInsight Spark 클러스터를 만듭니다. 이 클러스터에는 총 32개 코드와 함께 헤드 노드 2개, 작업자 노드 2개, 에지 노드 1개가 포함됩니다. 이 HDInsight Spark 클러스터에 대한 개략적인 비용은 $8.29/시간입니다. 클러스터를 만들면 청구가 시작되고 클러스터를 삭제하면 청구가 중지됩니다. 청구는 분 단위에 비례 계산되므로 클러스터를 더 이상 사용하지 않을 경우 항상 클러스터를 삭제해야 합니다. 작업을 완료한 후 배포 페이지를 사용하여 전체 솔루션을 삭제합니다.

개요

비즈니스에서는 신제품이나 기존 제품에 대한 고객의 관심을 끌기 위한 마케팅 캠페인을 시작할 경우 종종 비즈니스 규칙 집합을 사용하여 대상으로 지정할 캠페인에 대한 잠재 고객을 선택합니다. 기계 학습을 사용하여 이러한 잠재 고객의 응답 비율을 높일 수 있습니다. 이 솔루션은 모델을 사용하여 캠페인에서 대상으로 지정된 잠재 고객의 구매 비율을 최대화할 것으로 예상되는 작업을 예측하는 방법을 보여 줍니다. 이러한 예측은 대상 잠재 고객에게 연락할 방법(예: 메일, SMS 또는 권유 전화) 및 연락할 시기(요일 및 시간)에 대해 갱신된 캠페인에서 사용할 권장 사항의 기준으로 사용됩니다. 여기서 제공된 솔루션은 보험 산업의 시뮬레이트된 데이터를 사용하여 캠페인에 대한 잠재 고객의 응답을 모델링합니다. 모델 예측 변수에는 잠재 고객의 인구 통계 정보, 과거 캠페인 성과 및 제품별 세부 정보가 포함됩니다. 이 모델은 데이터베이스의 각 잠재 고객이 각 요일의 다양한 시간에 채널에서 구매할 가능성을 예측합니다. 대상 사용자가 모델에서 예측하는 채널 및 타이밍 조합을 기반으로 할 경우 사용할 채널, 요일 및 타이밍에 대한 권장 사항에는 구매가 이루어질 가장 큰 가능성이 있습니다.

비즈니스 관점

이 솔루션은 과거 캠페인 데이터를 이용하는 기계 학습을 적용하여 고객 응답을 예측하고 잠재 고객과 연결할 시기 및 방법을 추천합니다. 권장 사항에는 잠재 고객에게 연락할 최고의 채널(예제에서는 메일, SMS 또는 권유 전화), 연락할 최고의 요일 및 최고의 날짜가 포함됩니다.

HDInsight Spark 클러스터의 Microsoft R Server는 R Server와 Apache Spark의 결합된 기능을 이용하여 빅 데이터에 대해 분산된 확장 가능한 기계 학습 기능을 제공합니다. 이 솔루션은 마케팅 캠페인 최적화를 위해 기계 학습 모델을 개발하고(데이터 처리, 기능 엔지니어링, 학습 및 평가 모델 포함), 모델을 웹 서비스로 배포하고(에지 노드에), Azure HDInsight Spark 클러스터에서 Microsoft R Server를 통해 웹 서비스를 원격으로 사용하는 방법을 보여 줍니다. 최종 예측 및 권장 사항 테이블은 각 잠재 고객에게 연락할 방법 및 시기에 대한 권장 사항이 포함된 Hive 테이블에 저장됩니다. 이후 이 데이터는 Power BI에서 시각화됩니다.

Power BI는 캠페인 권장 사항의 효과에 대한 시각적 요약도 제공합니다(여기서는 시뮬레이트된 데이터를 사용하여 표시됨). 오른쪽에 있는 [지금 평가판 사용] 단추를 클릭하여 이 대시보드를 사용해 볼 수 있습니다.

이 대시보드의 [권장 사항] 탭에는 예측 권장 사항이 표시됩니다. 맨 위에는 새로운 배포에 대한 개별 잠재 고객 테이블이 있습니다. 여기에는 비즈니스 규칙을 적용할 잠재 고객으로 채워진 잠재 고객 ID, 캠페인 및 제품에 대한 필드가 포함됩니다. 필드 뒤에는 각 잠재 고객에게 연락할 최적 채널 및 시간을 제공하는 잠재 고객에 대한 모델 예측과 잠재 고객이 이러한 권장 사항에 따라 제품을 구매할 예상 가능성이 함께 제공됩니다. 이러한 가능성은 연락할 잠재 고객 수를 구매 가능성이 높은 하위 집합으로 제한하여 캠페인 효율성을 높이는 데 사용될 수 있습니다.

또한 [권장 사항] 탭에는 잠재 고객에 대한 권장 사항 및 인구 통계 정보의 다양한 요약이 있습니다. 대시보드의 [캠페인 요약] 탭에는 예측 권장 사항을 만드는 데 사용되는 기록 데이터의 요약이 표시됩니다. 이 탭에는 요일, 시간 및 채널 값도 표시되지만 이러한 값은 실제 과거 관찰의 결과이므로 [권장 사항] 탭에 표시된 모델의 권장 사항과 혼동하지 마세요.

데이터 과학자 관점

이 솔루션은 마케팅 캠페인 최적화를 위한 기계 학습 모델을 개발 및 배포하는 방법의 종단 간 프로세스를 보여 줍니다. 이 솔루션에는 모델을 빌드하고(데이터 처리, 기능 엔지니어링, 학습 및 평가 모델과 함께 샘플 데이터 포함), 모델을 웹 서비스로 배포하고(에지 노드에), Azure HDInsight Spark 클러스터에서 Microsoft R Server를 통해 웹 서비스를 원격으로 사용하는 각 단계에 대한 샘플 데이터, R 코드가 들어 있습니다.

이 솔루션을 테스트하는 데이터 과학자는 Azure HDInsight Spark 클러스터의 에지 노드에서 실행되는 RStudio Server의 브라우저 기반 오픈 소스 버전에서 제공된 R 코드를 사용할 수 있습니다. 컴퓨팅 컨텍스트를 설정하면 사용자가 에지 노드에서 로컬로 또는 Spark 클러스터의 여러 노드에서 분산하여 계산을 수행할지 결정할 수 있습니다. 모든 R 코드는 공개 Github 리포지토리에서도 찾을 수 있습니다. 즐겁게 사용하시기 바랍니다.

고지 사항

©2017 Microsoft Corporation. All rights reserved. 이 정보는 “있는 그대로” 제공되며 예고 없이 변경될 수 있습니다. Microsoft는 여기에 제공된 정보에 대해 어떠한 명시적 또는 묵시적 보증도 하지 않습니다. 타사 데이터는 솔루션을 생성하는 데 사용되었습니다. 유사한 데이터 집합을 만들기 위해 관련 라이선스를 확보하고 준수하는 것을 비롯한 다른 사람의 권리를 존중하는 것은 귀하의 책임입니다.

관련 솔루션 아키텍처

SQL Server를 사용한 캠페인 최적화

이 솔루션은 SQL Server 2016 with R Services를 통해 기계 학습 모델을 빌드 및 배포하여 캠페인에서 대상으로 지정된 잠재 고객의 구매 비율을 최대화할 수 있는 작업을 추천하는 방법을 보여 줍니다.