Ignorar navegação

Servidor R para HDInsight

Análise preditiva, machine learning e modelagem estatística para Big Data

O que é o Servidor R para HDInsight?

Ao combinar o software de análise de linguagem R de escala empresarial com o poder do Apache Hadoop e do Apache Spark, o Microsoft R Server para HDInsight fornece a escala e o desempenho que você precisa. As bibliotecas de matemática com multithread e a paralelização transparente no R Server lidam com uma quantidade de dados até mil vezes maior a velocidades até 50 vezes mais rápidas que a linguagem de software livre R, o que ajuda no treinamento de modelos mais precisos para obter previsões melhores. O R Server funciona com a linguagem R de software livre, por isso todos os seus scripts R são executados sem alterações.

Servidor R para HDInsight
  • Grande biblioteca portátil de aprendizado de máquina e análises paralelas de R
  • Aprendizado de máquina em escala de terabytes—1.000 vezes maior do que em R de código aberto
  • Oferecer um desempenho até 50x mais rápido usando o Microsoft R Server para Apache Spark 2.0 e bibliotecas de vetor/matemática otimizadas
  • Segurança e suporte de nível empresarial apoiados por um SLA da Microsoft
  • Acesse as fontes de dados Spark através do SQL do Spark
  • Configuração fácil para resultados rápidos

Trabalhe com a potência e a familiaridade da linguagem R

Como a primeira escolha de cientistas de dados, a linguagem de programação R tem uma comunidade global de mais de dois milhões de usuários pelo mundo e o número total de pacotes de análise de software livre vem crescendo a cada ano. O R Server para HDInsight oferece total compatibilidade com a linguagem R executando em escala no Hadoop e no Spark.

O uso do R está em ascensão. De 2007 a 2013, o número de mineradores de dados que declararam usar o R aumentou de 20% para 70%. De 2008 a 2013, o número de mineradores de dados que usam o R como ferramenta primária aumentou de menos de 5% para 24%.
O número de pacotes CRAN lançados aumentou consideravelmente nos últimos anos. Em 2005, havia uma quantidade muito pequena. O número aumentou para 1.000 em 2012 para 3.000 em 2014 e para mais de 8.000 em 2016.

Grande biblioteca portátil de aprendizado de máquina e análises paralelas de R

Aproveite uma grande biblioteca de aprendizado de máquina e análise paralela, criada para trabalhar com a linguagem R de software livre, que é portátil em plataformas de dados populares, incluindo árvores de decisão e conjuntos, modelos de regressão, clustering, preparação de dados, visualização e funções — estatísticas.

O aprendizado de máquina em escala de terabyte lida com 1.000 vezes mais dados

Com a paralelização transparente sobre o Hadoop e o Spark, o R Server para HDInsight permite que você manipule terabytes de dados 1.000 vezes mais do que a linguagem R de software—livre. Treine modelos de regressão logística, árvores e conjuntos em qualquer quantidade de dados. Você só é limitado pelo tamanho do cluster Spark.

Obtenha um desempenho até 50 vezes mais rápido

Combine o Spark, bibliotecas matemáticas de matriz e vetor multithread e R Server para HDInsight para experimentar um desempenho até 50 vezes mais rápido do que o possível anteriormente com o R de software livre.

Execute simulações e limpezas de parâmetros distribuídas com funções R existentes

Execute qualquer função R de software livre em centenas de nós para simulações e varreduras de parâmetros paralelos. Explore e refine seus modelos para previsões mais rápidas, fáceis e precisas.

Acesse as fontes de dados Spark através do SQL do Spark

Analise os dados no Hadoop e no Spark usando Apache Spark SQL como uma fonte de dados para o R Server. Carregue os resultados de uma consulta SQL do Spark em fontes como Apache Hive e Apache Parquet em um Quadro de Dados do Spark e analise-os diretamente usando qualquer algoritmo de computação distribuído do R Server.

Escolha suas ferramentas de desenvolvimento

O R Server no HDInsight inclui R Studio Server Community Edition, o que facilita a introdução. Baixe Ferramentas do R para Visual Studio gratuitamente para obter um ambiente de desenvolvimento local conveniente.

Suporte e segurança de nível empresarial

Conte com segurança e suporte de nível empresarial do Azure, que inclui pacotes de versão, aplicação de patch, atualizações de segurança e monitoramento contínuo de cluster. Um SLA (Microsoft Contrato de Nível de Serviço) com conectividade de 99,9% ajuda a proteger seus clusters R Server para HDInsight contra eventos catastróficos.

Configuração fácil, resultados rápidos

Não há instalação ou configuração demorada com o R Server para HDInsight. O Azure faz isso para você. Você estará pronto em minutos, pronto para treinar seus modelos estatísticos e de aprendizado de máquina, sem comprar novo hardware ou pagar outros custos ’ iniciais. Você paga apenas pela computação e pelo armazenamento que usa.

O Apache Hadoop® e os nomes de projetos de software livre associados são marcas da Apache Software Foundation.

Por que confiar em Servidor R para HDInsight?

  • A Microsoft investe mais de USD 1 bilhão anualmente em pesquisa e desenvolvimento de segurança cibernética.

  • Contamos com mais de 3,500 especialistas em segurança dedicados à privacidade e à segurança de dados.

  • O Azure tem mais certificações de conformidade que qualquer outro provedor de nuvem. Veja a lista completa.

Tudo o que você precisa para começar

Obtenha acesso instantâneo e um crédito de $200 ao se inscrever para uma conta do Azure gratuita.

Saiba como usar o Servidor R para HDInsight com a documentação e os tutoriais de início rápido de cinco minutos.

Aprimore Servidor R para HDInsight com recursos e produtos adicionais, como serviços de segurança e backup.

Experimente o Servidor R para HDInsight

Podemos ajudar você?