R Server pour HDInsight

Analyse prédictive, apprentissage automatique et modélisation statistique pour les Big Data utilisant R

  • La plus grande bibliothèque portable en langage R d’apprentissage automatique et d’analyse parallèle
  • Apprentissage automatique à l’échelle de téraoctets, soit 1 000 fois plus que dans R open source
  • Obtenez des performances jusqu’à 50 fois plus rapides avec R Server pour Apache Spark 2.0 et les bibliothèques de vecteurs/mathématiques optimisées
  • Support et sécurité à l’échelle de l’entreprise reposant sur un contrat de niveau de service (SLA) Microsoft
  • Accédez aux sources de données Spark via Spark SQL
  • Configurer facilement pour des résultats rapides
R Server pour HDInsight

Qu’est-ce que R Server pour HDInsight ?

En combinant le logiciel d’analyse R de qualité professionnelle à la puissance d’Hadoop et de Spark, R Server pour HDInsight offre un niveau de puissance et de performances inédit. Grâce aux bibliothèques mathématiques multithread et à la parallélisation transparente dans R Server, gérez 1 000 fois plus de données avec une rapidité 50 fois supérieure à celle du R open source. Vous pouvez ainsi former des modèles plus précis pour obtenir de meilleures prédictions qu’auparavant. Enfin, R Server étant conçu pour fonctionner avec le langage R open source, tous vos scripts R s’exécutent sans aucune modification.

Exploitez la puissance et la facilité d’utilisation de R

En tant que choix privilégié des experts en science des données, le langage de programmation R s’appuie sur une communauté mondiale prospère de plus de deux millions d’utilisateurs, et un nombre total de packages d’analyse open source croissant de façon exponentielle d’année en année. Avec R Server pour HDInsight, vous bénéficiez d’une compatibilité totale avec le langage R s’exécutant à grande échelle sur Hadoop et Spark.

L’utilisation de R est en augmentation. De 2007 à 2013, le nombre d’explorateurs de données qui déclarent utiliser R est passé de 20 % à 70 %. De 2008 à 2013, le nombre d’explorateurs de données utilisant R comme leur outil principal est passé de moins de 5 % à 24 %.
Le nombre de packages CRAN publiés a augmenté de manière significative au cours des dernières années. En 2005, il y en avaient peu. Ils sont passés de 1000 en 2012, à 3000 en 2014 et à plus de 8000 en 2016.
Bibliothèque d’analyse et d’apprentissage automatique en langage R

La plus grande bibliothèque portable en langage R d’apprentissage automatique et d’analyse parallèle

Tirez profit de la plus grande bibliothèque d’analyse parallèle et d’apprentissage conçue pour fonctionner avec le langage open source R. L’ensemble est portable sur toutes les grandes plateformes de données : arbres et ensembles de décision, modèles de régression, mise en cluster, préparation des données, visualisation et fonctions statistiques.

Utilisez des téraoctets de données avec R Server pour HDInsight

Apprentissage automatique de plusieurs téraoctets pour traiter 1 000 fois plus de données

Avec une parallélisation transparente sur Hadoop et Spark, R Server pour HDInsight vous permet de traiter plusieurs téraoctets de données, soit 1 000 fois plus qu’auparavant avec le langage R open source seul. Entraînez des modèles de régression logistique, des arbres et des ensembles sur n’importe quel volume de données. La seule limite est celle de la taille de votre cluster Spark.

Performances rapides avec R Server pour HDInsight

Obtenez des performances jusqu’à 50 fois plus rapides

Associées à Spark, les bibliothèques mathématiques multithread de vecteurs et de matrices ajoutées à R Server pour HDInsight offrent des performances jusqu’à 50 fois plus rapides qu’auparavant avec R open source.

Exécutez des fonctions R open source

Exécutez des simulations et organisations de paramètres distribués avec des fonctions R existantes

Exécutez n’importe quelle fonction R open source sur des centaines de nœuds pour des simulations et organisations de paramètres parallèles. Explorez et affinez vos modèles pour obtenir des prédictions plus rapides, plus simples et plus précises.

Accédez aux sources de données Spark via Spark SQL

L’analyse de données dans Hadoop et Spark est encore plus simple, avec Spark SQL comme source de données pour R Server. Chargez les résultats de la requête Spark SQL sur une source, par exemple Apache Hive et Parquet dans un Spark Data Frame, et analysez-les directement avec n’importe quel algorithme R Server de calcul distribué.

Utilisez les outils de développement de votre choix

R Server sur HDInsight comprend R Studio Server Community Edition, pour simplifier la mise en route pour les experts en science des données. Vous pouvez également télécharger R Tools pour Visual Studio gratuitement pour bénéficier d’un environnement de développement local.

Sécurité professionnelle pour protéger R Server pour HDInsight

Support et sécurité à l’échelle de l’entreprise

Bénéficiez de la sécurité à l’échelle de l’entreprise et du support fourni par Azure, notamment des packages de version, des mises à jour correctives, des mises à jour de sécurité, et d’une surveillance de cluster continue. De plus, un contrat de niveau de service (SLA) Microsoft avec 99,9 % de connectivité garantie permet de protéger tous vos clusters R Server pour HDInsight de tout événement catastrophique.

Configuration rapide et sans frais initiaux

Installation facile et résultats rapides

Avec R Server pour HDInsight, aucune installation ou configuration fastidieuse n’est requise. Azure s’en charge à votre place. Vous êtes opérationnel en quelques minutes et prêt à former vos modèles statistiques et d’apprentissage automatique sans devoir acheter de nouveau matériel ni vous exposer à des coûts de démarrage. Vous payez uniquement pour le volume de calcul et de stockage que vous utilisez.

Apache Hadoop® et les noms de projets open source associés sont des marques de Apache Software Foundation.

Essayez R Server pour HDInsight