Otimização de Campanhas com Clusters do Azure HDInsight Spark

Esta solução demonstra como criar e implementar um modelo de aprendizagem automática com o Microsoft R Server nos clusters do Azure HDInsight Spark para recomendar ações para maximizar a taxa de compra das oportunidades potenciais visadas por uma campanha. Esta solução permite o processamento eficiente de macrodados no Spark com o Microsoft R Server.

Descrição

Nota: se já tiver implementado esta solução, clique aqui para ver a sua implementação.

Tempo de Aprovisionamento Estimado: 25 Minutos

Esta solução criará um cluster do HDInsight Spark com o Microsoft R Server. Este cluster conterá 2 nós principais, 2 nós de trabalho e 1 nó periférico com um total de 32 núcleos. O custo aproximado deste cluster do HDInsight Spark é de $8.29/hora. A faturação tem início quando o cluster é criado e termina quando é eliminado. A faturação é rateada por minuto, pelo que deve sempre eliminar o cluster quando deixar de ser utilizado. Utilize a página Implementações para eliminar toda a solução quando terminar.

Descrição geral

Quando uma empresa lança uma campanha de marketing para despertar o interesse dos clientes em produtos novos ou existentes, muitas vezes utilizam um conjunto de regras de negócio para selecionar oportunidades potenciais que a campanha irá visar. A aprendizagem automática pode ser utilizada para ajudar a aumentar a taxa de resposta destas oportunidades potenciais. Esta solução demonstra como utilizar um modelo para prever ações que se espera que maximizem a taxa de compra das oportunidades potenciais visadas pela campanha. Estas predições servem como base para as recomendações que serão utilizadas numa nova campanha relativamente a como contactar (por exemplo, por e-mail, SMS ou chamada não solicitada) e quando contactar (dia da semana e hora do dia) as oportunidades potenciais visadas. A solução aqui apresentada utiliza dados simulados do setor dos seguros para modelar respostas das oportunidades potenciais à campanha. Os indicadores do modelo incluem dados demográficos das oportunidades potenciais, o desempenho histórico da campanha e dados específicos do produto. O modelo prevê a probabilidade de cada oportunidade potencial na base de dados fazer uma compra a partir de um canal, em cada dia da semana a diversas horas do dia. As recomendações relativas a que canal, dia da semana e hora do dia a utilizar ao visar utilizadores baseiam-se, desta forma, na combinação de canal e tempo que o modelo prevê que irá ter a maior probabilidade de resultar numa compra.

Perspetiva Empresarial

Esta solução emprega dados históricos das campanhas que tiram partido da aprendizagem automática para prever as respostas dos clientes e recomendar como e quando se deve ligar às suas oportunidades potenciais. As recomendações incluem o melhor canal para contactar uma oportunidade potencial (no nosso exemplo, e-mail, SMS ou chamada não solicitada), o melhor dia da semana e a melhor hora do dia para estabelecer o contacto.

O Microsoft R Server nos clusters do HDInsight Spark oferece capacidades de aprendizagem automática distribuídas e dimensionáveis para macrodados, aliando o poder do R Server e do Apache Spark. Esta solução demonstra como desenvolver modelos de aprendizagem automática para a otimização de campanhas de marketing (incluindo processamento de dados, engenharia de funcionalidades, formação e modelos de avaliação), implementar os modelos como um serviço Web (no nó periférico) e como consumir o serviço Web remotamente com o Microsoft R Server nos clusters do Azure HDInsight Spark. As predições finais e a tabela de recomendações são guardadas numa tabela do Hive que contém recomendações sobre como e quando deve contactar cada oportunidade potencial. Em seguida, estes dados são visualizados no Power BI.

O Power BI também apresenta resumos visuais da eficácia das recomendações da campanha (apresentadas aqui como dados simulados). Pode experimentar este dashboard ao clicar no botão Experimente Já.

O separador Recomendações deste dashboard mostra as recomendações previstas. Na parte superior, encontra-se uma tabela de oportunidades potenciais individuais para a sua nova implementação. Esta tabela inclui campos para o ID da oportunidade potencial, campanha e produto, preenchidos com oportunidades potenciais nas quais as nossas regras de negócio serão aplicadas. É seguida das predições de modelos para as oportunidades potenciais, que são o canal e a hora ideal para contactar cada uma delas, juntamente com as probabilidades estimadas de as oportunidades potenciais comprarem o nosso produto com base nestas recomendações. Estas probabilidades podem ser utilizadas para aumentar a eficiência da campanha ao limitar o número de oportunidades potenciais contactadas ao subconjunto com a maior probabilidade de comprar.

Também no separador Recomendações, estão vários resumos de recomendações e informações demográficas sobre as oportunidades potenciais. O separador Resumo da Campanha do dashboard mostra resumos dos dados históricos utilizados para criar as recomendações previstas. Embora este separador também mostre os valores de Dia da Semana, Hora do Dia e Canal, estes valores são observações passadas reais, que não devem ser confundidas com as recomendações do modelo apresentadas no separador Recomendações.

Perspetiva do Cientista de Dados

Esta solução demonstra o processo ponto a ponto de desenvolvimento e implementação de modelos de aprendizagem automática para a otimização de campanhas de marketing. Contém dados de exemplo, código R para cada passo de criação do modelo (incluindo processamento de dados, engenharia de funcionalidades, formação e modelos de avaliação juntamente com os dados de exemplo), implementação do modelo como um serviço Web (no nó periférico) e consumo do serviço Web remotamente com o Microsoft R Server nos clusters do Azure HDInsight Spark.

Os cientistas de dados que estão a testar esta solução podem trabalhar com o código R fornecido a partir do Open Source Edition do RStudio Server baseado no browser executado no Nó Periférico do cluster do Azure HDInsight Spark. Ao definir o contexto de computação, o utilizador pode decidir onde será realizada a computação: localmente no nó periférico ou distribuída pelos nós no cluster do Spark. Também pode encontrar todo o código R no repositório público do Github. Divirta-se!

Exclusão de Responsabilidade

©2017 Microsoft Corporation. Todos os direitos reservados. A informação é fornecida "tal como está" e pode ser alterada sem aviso prévia. A Microsoft não faz garantias, de forma expressa ou implícita, em relação à informação aqui fornecida. Foram utilizados dados de terceiros para gerar a Solução. É responsável por respeitar os direitos de outros, incluindo a aquisição e conformidade com as licenças relevantes para criar conjuntos de dados semelhantes.

Arquiteturas de soluções relacionadas

Otimização de Campanhas com o SQL Server

Esta solução demonstra como criar e implementar um modelo de aprendizagem automática com o SQL Server 2016 com R Services para recomendar ações para maximizar a taxa de compra de oportunidades potenciais visadas por uma campanha.