Ignorar navegação

Otimização de Campanha com Clusters Azure HDInsight Spark

Esta solução demonstra como criar e implantar um modelo de aprendizado de máquina com o Microsoft R Server em clusters do Azure HDInsight Spark para recomendar ações para maximizar a taxa de compra dos leads aos quais uma campanha se destina. Essa solução permite a manipulação eficiente de Big Data no Spark com o Microsoft R Server.

Descrição

Observação: se você já tiver implantado esta solução, clique aqui para exibir sua implantação.

Tempo de provisionamento estimado: 25 minutos

Essa solução criará um cluster HDInisght Spark com Microsoft R Server. Esse cluster contém 2 nós de cabeçalho, 2 nós de trabalho e 1 nó de borda com um total de 32 núcleos. O custo aproximado para esse cluster do HDInsight Spark é de $8.29/hora. A cobrança começa após a criação de um cluster e termina quando o cluster é excluído. A cobrança é rateada por minuto, portanto, você sempre deve excluir seu cluster quando ele não está mais em uso. Use a página Implantações para excluir toda a solução assim que tiver concluído.

Visão geral

Ao iniciar uma campanha de marketing para clientes interessados em produtos novos ou existentes, uma empresa geralmente usa um conjunto de regras de negócio para selecionar leads para os quais a campanha deve se destinar. O aprendizado de máquina pode ser usado para ajudar a aumentar a taxa de resposta desses leads. Esta solução demonstra como usar um modelo para prever ações que devem maximizar a taxa de compra dos leads aos quais campanha se destina. Essas previsões servem como a base para as recomendações a serem usadas por uma campanha com uma renovação nas formas de entrar em contato (por exemplo, email, SMS ou telemarketing) e quando entrar em contato (dia da semana e hora do dia) com os leads aos quais essa campanha se destina. A solução apresentada aqui usa dados simulados do setor de seguros para modelar respostas dos leads para a campanha. Os previsores do modelo incluem detalhes demográficos dos leads, desempenho histórico de campanhas e detalhes específicos de produtos. O modelo prevê a probabilidade de cada lead no banco de dados realizar uma compra em um canal, em cada dia da semana e em diversas horas do dia. As recomendações de qual canal, qual dia da semana e qual hora do dia usar para selecionar usuários são baseadas na combinação entre o canal e o momento exato, previstos pelo modelo, em que haverá a maior probabilidade de uma compra ser realizada.

Perspectiva de negócios

Essa solução implanta o aprendizado de máquina aproveitando dados de campanha históricos para prever respostas de clientes e recomendar quando e como se conectar com seus leads. As recomendações incluem o melhor canal para entrar em contato com um lead (no nosso exemplo, email, SMS ou telemarketing), o melhor dia da semana e a melhor hora do dia para fazer o contato.

O Microsoft R Server nos clusters do HDInsight Spark oferece funcionalidades de aprendizado de máquina distribuídas e escalonáveis para Big Data, aproveitando o poder combinado do R Server e do Apache Spark. Essa solução demonstra como desenvolver modelos de aprendizado de máquina para otimização da campanha de marketing (incluindo processamento de dados, engenharia de recursos, modelos de treinamento e avaliação), implantar os modelos como serviço Web (no nó de borda) e consumir o serviço Web remotamente com Microsoft R Server em clusters do Azure HDInsight Spark. As previsões finais e a tabela de recomendações são salvas em uma tabela do Hive contendo recomendações para como e quando entrar em contato com cada lead. Os dados são, em seguida, visualizados no Power BI.

O Power BI também apresenta resumos visuais da eficácia das recomendações de campanha (mostrados aqui com os dados simulados). Você pode experimentar esse dashboard clicando no link Experimentar Agora à direita.

A guia Recomendações desse dashboard mostra as recomendações previstas. Na parte superior, há uma tabela de cada lead da nossa nova implantação. Ela inclui campos para a ID do lead, para a campanha e para o produto, populados com leads nos quais nossas regras comerciais devem ser aplicadas. Ela é acompanhada das previsões do modelo dos leads, oferecendo o canal e o horário ideais para entrar em contato com cada um deles, junto com as probabilidades estimadas de os leads comprarem nosso produto usando essas recomendações. Essas probabilidades podem ser usadas para aumentar a eficiência da campanha limitando o número de leads contatados a um subconjunto dos que têm maior probabilidade de comprar.

Além disso, na guia Recomendações, também há diversos resumos de recomendações e informações demográficas sobre os leads. A guia Resumo de Campanha do dashboard mostra resumos dos dados históricos usados para criar as recomendações previstas. Embora essa guia também mostre valores de Dia da Semana, Hora do Dia e Canal, esses valores na verdade são observações passadas e não devem ser confundidos com as recomendações do modelo mostradas na guia Recomendações.

Perspectiva do cientista de dados

Essa solução demonstra o processo de ponta a ponta de como desenvolver e implantar modelos de aprendizado de máquina para otimização de campanhas de marketing. Ela contém dados de exemplo, código R para cada etapa para criar o modelo (incluindo processamento de dados, engenharia de recursos, modelos de treinamento e avaliação junto com os dados de exemplo), implantar o modelo como um serviço Web (no nó de borda) e consumir o serviço Web remotamente com Microsoft R Server em clusters do Azure HDInsight Spark.

Os cientistas de dados que estão testando essa solução podem trabalhar com o código R fornecido do Open Source Edition com base em navegador do RStudio Server que é executado no Nó de Borda do cluster do Azure HDInsight Spark. Ao configurar o contexto de computação, o usuário pode decidir se a computação será realizada localmente no nó de borda ou distribuída entre os nós no cluster Spark. Todo o código R também pode ser encontrado no repositório GitHub público. Divirta-se!

Aviso de isenção de responsabilidade

© 2017 Microsoft Corporation. Todos os direitos reservados. Estas informações são fornecidas “no estado em que se encontram” e poderão ser alteradas sem aviso. A Microsoft não oferece garantias, expressas ou implícitas, com relação às informações aqui fornecidas. Dados de terceiros foram utilizados para gerar esta Solução. Você é responsável por respeitar os direitos de terceiros, incluindo a obtenção e o cumprimento de licenças relevantes com o intuito de criar conjuntos de dados similares.

Arquiteturas de solução relacionadas

Otimização de campanhas com o SQL Server

Esta solução demonstra como criar e implantar um modelo de aprendizado de máquina com o SQL Server 2016 com R Services para recomendar ações a fim de maximizar a taxa de compra dos clientes potenciais que são direcionados por uma campanha.