Servidor R para HDInsight

Análise preditiva, machine learning e modelagem estatística para Big Data

Servidor R para HDInsight

O que é o Servidor R para HDInsight?

Ao combinar o software de análise de linguagem R de escala empresarial com o poder do Apache Hadoop e do Apache Spark, o Microsoft R Server para HDInsight fornece a escala e o desempenho que você precisa. As bibliotecas de matemática com multithread e a paralelização transparente no R Server lidam com uma quantidade de dados até mil vezes maior a velocidades até 50 vezes mais rápidas que a linguagem de software livre R, o que ajuda no treinamento de modelos mais precisos para obter previsões melhores. O R Server funciona com a linguagem R de software livre, por isso todos os seus scripts R são executados sem alterações.

Trabalhe com a potência e a familiaridade da linguagem R

Como a primeira escolha de cientistas de dados, a linguagem de programação R tem uma comunidade global de mais de dois milhões de usuários pelo mundo e o número total de pacotes de análise de software livre vem crescendo a cada ano. O R Server para HDInsight oferece total compatibilidade com a linguagem R executando em escala no Hadoop e no Spark.

O uso do R está em ascensão. De 2007 a 2013, o número de mineradores de dados que declararam usar o R aumentou de 20% para 70%. De 2008 a 2013, o número de mineradores de dados que usam o R como ferramenta primária aumentou de menos de 5% para 24%.
O número de pacotes CRAN lançados aumentou consideravelmente nos últimos anos. Em 2005, havia uma quantidade muito pequena. O número aumentou para 1.000 em 2012 para 3.000 em 2014 e para mais de 8.000 em 2016.
Biblioteca de aprendizado de máquina e análise do R

Grande biblioteca portátil de aprendizado de máquina e análises paralelas de R

Aproveite uma grande biblioteca de análises paralelas e aprendizado de máquina, criada para trabalhar com a linguagem R de software livre, que é portátil entre plataformas de dados populares e inclui conjuntos e árvores de decisão, modelos de regressão, clustering, preparação de dados, visualização e funções estatísticas.

Use terabytes de dados com o Servidor R para HDInsight

O aprendizado de máquina em escala de terabyte lida com 1.000 vezes mais dados

Com paralelização transparente além do Hadoop e do Spark, o Servidor R para HDInsight permite que você lide com terabytes de dados – 1.000 vezes mais que usando somente a linguagem R de software livre. Treine modelos de regressão logística, árvores e conjuntos em qualquer quantia de dados. Você está limitado apenas pelo tamanho do seu cluster do Spark.

Desempenho rápido com o Servidor R para HDInsight

Obtenha um desempenho até 50 vezes mais rápido

Combine o Spark, um vetor de vários threads e bibliotecas de matemática de matriz, com o Servidor R para HDInsight para experimentar um desempenho até 50 vezes mais rápido do que era possível com o R de software livre.

Execute as funções do R de software livre

Execute simulações e limpezas de parâmetros distribuídas com funções R existentes

Execute qualquer função R de software livre em centenas de nós para obter simulações e limpezas de parâmetros paralelas. Explore e refine seus modelos para previsões mais rápidas, fáceis e precisas.

Acesse as fontes de dados Spark através do SQL do Spark

Analise dados no Hadoop e no Spark usando o SQL do Apache Spark como fonte de dados para o R Server. Carregue em um Spark Data Frame os resultados de uma consulta do Spark SQL a fontes como Apache Hive e Apache Parquet, depois analise-os diretamente usando quaisquer algoritmos de computação distribuída pelo R Server.

Escolha suas ferramentas de desenvolvimento

O R Server no HDInsight inclui o R Studio Server Community Edition, que facilita o início da utilização. Baixe as Ferramentas do R para Visual Studio de forma gratuita para obter um ambiente de desenvolvimento local conveniente.

Segurança de nível empresarial para proteger o Servidor R para HDInsight

Suporte e segurança de nível empresarial

Conte com a segurança de nível empresarial e o suporte do Azure, que inclui pacotes de versão, aplicação de patch, atualizações de segurança e monitoramento de cluster contínuo. Um SLA (Contrato de Nível de Serviço) da Microsoft com 99,9% de conectividade ajuda a proteger seus clusters do R Server para HDInsight contra eventos catastróficos.

Configuração rápida e nenhum custo antecipado

Configuração fácil, resultados rápidos

Não há nenhuma instalação nem configuração demorada com o R Server para HDInsight. O Azure faz isso por você. Você estará com tudo funcionando em questão de minutos, pronto para treinar seus modelos estatísticos e de aprendizado de máquina sem precisar comprar hardware novo nem pagar outros custos iniciais. Você só paga pela computação e pelo armazenamento que usar.

O Apache Hadoop® e os nomes de projetos de software livre associados são marcas da Apache Software Foundation.

Experimente o Servidor R para HDInsight