Optimización de campañas con clústeres de Azure HDInsight Spark

Esta solución muestra cómo crear e implementar un modelo de aprendizaje automático con Microsoft R Server en clústeres de Azure HDInsight Spark para recomendar acciones que maximicen la tasa de compras de los clientes potenciales a los que va dirigida una campaña. Esta solución permite un control eficaz de macrodatos en Spark con Microsoft R Server.

Descripción

Nota: Si ya ha implementado esta solución, haga clic aquí para ver la implementación.

Tiempo de aprovisionamiento estimado: 25 minutos

Esta solución crea un clúster de HDInisght Spark con Microsoft R Server. Este clúster contiene 2 nodos principales, 2 nodos de trabajo y 1 nodo perimetral con un total de 32 núcleos. El costo aproximado de este clúster de HDInsight Spark es $8.29/hora. La facturación comienza cuando se crea el clúster y se detiene cuando este se elimina. Se prorratea por minutos, por lo que siempre debe eliminar el clúster cuando ya no se utilice. Use la página Implementaciones para eliminar toda la solución cuando haya terminado.

Información general

Cuando una empresa lanza una campaña de marketing para despertar el interés de los clientes sobre productos nuevos o que ya existían, a menudo utiliza un conjunto de reglas de negocio para seleccionar clientes potenciales a los que dirigir la campaña. Para aumentar la tasa de respuesta de estos clientes potenciales, se puede usar aprendizaje automático. Esta solución muestra cómo usar un modelo para predecir acciones que se espera que maximicen la tasa de compras de los clientes potenciales a los que va dirigida la campaña. Estas predicciones sirven de base para recomendaciones que deben usarse en una campaña renovada en cuanto a cómo ponerse en contacto con los clientes potenciales (por ejemplo, por correo electrónico, SMS o telemarketing) y cuándo (día de la semana y hora del día). La solución que se presenta aquí utiliza datos simulados del sector asegurador para elaborar un modelo de respuestas de los clientes potenciales a la campaña. Como factores de predicción del modelo, se utilizan los datos demográficos de los clientes potenciales, el rendimiento histórico de las campañas y los detalles específicos de los productos. El modelo predice la probabilidad de que cada cliente potencial de la base de datos realice una compra en un canal, cada día de la semana a varias horas del día. Las recomendaciones sobre qué canal, qué día de la semana y qué hora del día son mejores para dirigirse a los usuarios se basan, por tanto, en la combinación de canal, día y hora que, según el modelo, tiene la mayor probabilidad de que se realice una compra.

Perspectiva empresarial

Esta solución utiliza aprendizaje automático con datos de campañas anteriores para predecir la respuesta de los clientes y recomendar cuándo y cómo ponerse en contacto con clientes potenciales. Ofrece recomendaciones, como el mejor canal para ponerse en contacto con el cliente potencial (en nuestro ejemplo, correo electrónico, SMS o telemarketing), el mejor día de la semana y la mejor hora del día para ponerse en contacto.

Microsoft R Server en clústeres de Spark en HDInsight proporciona funcionalidad de aprendizaje automático distribuida y escalable para macrodatos, aprovechando el potencial combinado de R Server y Apache Spark. Esta solución muestra cómo desarrollar modelos de aprendizaje automático para optimizar campañas de marketing (incluidos el procesamiento de datos, el diseño de características, el entrenamiento y la evaluación de modelos), implementar los modelos como un servicio web (en el nodo perimetral) y consumir el servicio web en modo remoto con Microsoft R Server en clústeres de Azure HDInsight Spark. Las predicciones finales se guardan en una tabla de Hive que contiene también recomendaciones sobre cómo y cuándo ponerse en contacto con cada cliente potencial. Después, estos datos se visualizan en Power BI.

Power BI muestra también resúmenes visuales de la efectividad de las recomendaciones para la campaña (aquí se muestran con datos simulados). Para probar este panel, haga clic en el botón Probarlo ahora de la derecha.

La ficha Recommendations (Recomendaciones) de este panel muestra las recomendaciones previstas. En la parte superior, hay una tabla de clientes potenciales individuales para la nueva implementación. Esta tabla incluye campos para el identificador del cliente potencial, la campaña y el producto, rellenos con clientes potenciales a los que se van a aplicar nuestras reglas de negocio. Le siguen las predicciones de modelo para los clientes potenciales, con el canal y la hora óptimos para ponerse en contacto con cada uno de ellos, junto con una estimación de las probabilidades de que los clientes potenciales compren nuestro producto usando estas recomendaciones. Estas probabilidades se pueden usar para aumentar la eficacia de la campaña limitando el número de clientes potenciales con los que se establece contacto al subconjunto con mayor probabilidad de compra.

La ficha Recommendations (Recomendaciones) incluye también varios resúmenes de recomendaciones e información demográfica de los clientes potenciales. La ficha Campaign Summary (Resumen de campaña) del panel muestra resúmenes de los datos históricos usados para crear las recomendaciones previstas. Si bien esta ficha muestra también valores de día de la semana, hora del día y canal, estos valores son observaciones pasadas reales, no deben confundirse con las recomendaciones del modelo, que se muestran en la ficha Recommendations (Recomendaciones).

Perspectiva de científico de datos

Esta solución muestra el proceso completo para desarrollar e implementar modelos de aprendizaje automático para la optimización de campañas de marketing. Contiene datos de ejemplo, código de R para cada paso de la creación del modelo (incluidos el procesamiento de datos, el diseño de características, el entrenamiento y la evaluación de modelos), la implementación de los modelos como un servicio web (en el nodo perimetral) y el consumo del servicio web en modo remoto con Microsoft R Server en clústeres de Azure HDInsight Spark.

Los científicos de datos que prueben esta solución pueden trabajar con el código de R proporcionado desde la edición de código abierto de RStudio Server basada en explorador que se ejecuta en el nodo perimetral del clúster de Azure HDInsight Spark. Al establecer el contexto de proceso, el usuario puede decidir dónde se llevará a cabo: de forma local en el nodo perimetral o de forma distribuida en los nodos del clúster de Spark. Todo el código de R se puede encontrar también en el repositorio público de Github. ¡Diviértase!

Declinación de responsabilidades

©2017 Microsoft Corporation. Todos los derechos reservados. Esta información se proporciona "tal cual" y puede cambiar sin previo aviso. Microsoft no ofrece ninguna garantía, ni expresa ni implícita, respecto a la información que aquí se proporciona. Para generar la solución, se utilizaron datos de terceros. Usted es responsable de respetar los derechos de otros, incluida la adquisición y el cumplimiento de las licencias correspondientes para crear conjuntos de datos similares.

Arquitecturas de soluciones relacionadas

Optimización de campañas con SQL Server

Esta solución muestra cómo crear e implementar un modelo de aprendizaje automático con SQL Server 2016 con R Services para recomendar acciones que maximicen la tasa de compras de los clientes potenciales a los que va dirigida una campaña.