Questions? Feedback? powered by Olark live chat software
Passer la navigation

HDInsight

Un service cloud géré Apache Hadoop, Spark, R, HBase et Storm facile d’utilisation

Ensemble complet de projets Big Data Apache gérés

Évoluer de façon élastique à la demande

Azure HDInsight est une distribution Apache Hadoop proposée sur le cloud. Cela signifie qu’elle peut gérer un volume quelconque de données pouvant passer à la demande de quelques téraoctets à plusieurs pétaoctets. Lancez n'importe quel nombre de nœuds à tout moment. Nous ne facturons que le calcul et le stockage que vous utilisez.

Beth Israel Deaconess Medical Center
Nos exigences en matière d'audit nous imposent de conserver nos données pendant sept ans. Certaines informations doivent même être conservées pendant 30 ans. Avec HDInsight, nous pouvons stocker davantage de données et les interroger si nécessaire.

–Don Wood, Beth Israel Deaconess Medical Center

Azure HDInsight offre des services cloud permettant de gérer toute quantité de données
Les services cloud Hadoop vous permettent d’analyser facilement des jeux de données volumineux

Traitez l’ensemble des données : structurées, semi-structurées et non structurées

Comme il est entièrement basé sur Apache Hadoop, HDInsight peut traiter des données non structurées ou semi-structurées à partir de parcours web, de réseaux sociaux, de journaux de serveur, d'appareils, de capteurs et bien plus encore. Cela vous permet d'analyser de nouveaux jeux de données qui donnent jour à de nouvelles possibilités permettant de mener votre organisation à un niveau supérieur.

Ascribe
Avec une solution basée sur SQL Server et le service Azure HDInsight, nous pouvons recueillir des données écrites en langage courant, et les utiliser pour améliorer les services. Cela révolutionnera la manière dont nous traiterons les dossiers médicaux à l'avenir.

–Paul Henderson, Ascribe

Développer dans votre langage favori

HDInsight possède des extensions de programmation performantes pour de nombreux langages tels que C#, Java et .NET. Utilisez le langage de programmation de votre choix sur Hadoop pour la création, la configuration, la soumission et la surveillance de travaux Hadoop. En savoir plus
Utilisez le langage de programmation de votre choix avec le service cloud Hadoop
Les services cloud Hadoop d’Azure HDInsight sont disponibles dans le cloud sans frais initiaux

L’achat et la maintenance de matériel ne sont plus nécessaires

HDInsight permet de déployer Hadoop dans le cloud sans achat de matériel ni frais initiaux. L'installation et la configuration prennent également peu de temps. Azure s'en charge pour vous. Lancez votre premier cluster en quelques minutes.

McKesson
Étant donné qu'avec Azure, nous sommes sur un cloud élastique, nous ne devons pas nous préoccuper de la configuration de l'infrastructure ou de savoir si nous pouvons soutenir une croissance avec la capacité actuelle de nos centres de données.

–Sujatha Bayyapureddy, McKesson

Utilisez Excel ou un autre outil d’aide à la décision pour visualiser les données Hadoop

Étant intégré avec Excel, HDInsight permet de visualiser et d'analyser vos données Hadoop à l'aide de nouvelles méthodes attrayantes dans un outil que les utilisateurs de votre entreprise connaissent bien. Depuis Excel, les utilisateurs peuvent en effet sélectionner HDInsight comme source de données.

Black Ball
J'ai examiné quelques autres solutions d'aide à la décision disponibles sur le marché. La plupart m'ont semblé excessivement complexes, en particulier du point de vue de l'utilisateur final.

–Andrew Cheong, BlackBall

Utilisez Excel pour visualiser toutes vos données Hadoop
Utilisez le cloud pour connecter des clusters Hadoop locaux

Connectez des clusters Hadoop locaux au cloud

HDInsight est également intégré avec Hortonworks Data Platform. Vous pouvez ainsi déplacer des données Hadoop d'un centre de données local vers le cloud Azure à des fins de sauvegarde, de développement/test et de débordement de charge (ou « Cloud Bursting »). Microsoft Analytics Platform System permet même d'interroger vos clusters Hadoop locaux et sur le cloud simultanément.

Personnalisez les clusters pour exécuter d'autres projets Hadoop

Cet écosystème Apache Hadoop est un portefeuille de projets open source qui évoluent rapidement. HDInsight offre la flexibilité de pouvoir déployer des projets Hadoop arbitraires via des scripts personnalisés. Cela inclut des projets bien connus tels que Spark, R, Giraph et Solr.

Utilisez les fonctionnalités transactionnelles NoSQL offertes par Azure

Utilisez des fonctionnalités transactionnelles NoSQL

HDInsight inclut également Apache HBase, une base de données NoSQL en colonnes qui s'exécute sur le système HDFS (Hadoop Distributed File System). Vous pouvez ainsi effectuer un traitement transactionnel en ligne (OLTP) volumineux de données non relationnelles, et autoriser des cas d'utilisation comme l'écriture de sites web interactifs ou de données de capteur dans le stockage d'objets blob Azure.

Traitement des flux en temps réel

HDInsight inclut Apache Storm, plateforme d'analyse de flux open source qui peut traiter les événements en temps réel à grande échelle. Vous pouvez ainsi traiter des millions d'événements à mesure qu'ils sont générés en activant les cas d'utilisation tels que l'Internet des objets et en obtenant des informations de vos appareils connectés ou des événements déclenchés sur le web. Nous facilitons le déploiement et l'implémentation de Storm. En savoir plus sur Storm

Utilisez Spark à des fins d'analyse interactive

HDInsight inclut Apache Spark, un projet open source de l'écosystème Apache qui permet d'exécuter des applications d'analyse de données à grande échelle en mémoire. Spark offre des requêtes 100 fois plus rapides que les requêtes Big Data classiques. Il fournit un modèle d'exécution commun pour diverses tâches, telles qu'ETL, les requêtes par lots, les requêtes interactives, le streaming en temps réel, l'apprentissage automatique et le traitement des graphiques pour les données stockées dans Azure Storage. En savoir plus sur Spark

Utilisez R pour la prise en charge de la modélisation prédictive et de l’apprentissage automatique

HDInsight intègre R Server pour Hadoop, une implémentation avec montée en charge de l’un des langages de programmation les plus répandus pour le calcul statistique et l’apprentissage automatique. R Server sur HDInsight est une implémentation cloud de R 100 pour cent open source, intégrée avec des clusters Hadoop et Spark clusters. Elle offre l’aspect familier de R associé à l’extensibilité et aux performances de Hadoop. En savoir plus sur R Server pour HDInsight

Déploiement sur Windows et Linux

Sélectionnez des clusters Linux ou Windows lors du déploiement de charges de travail Big Data dans Azure. Avec Windows, utilisez le code Windows existant, notamment .NET, pour mettre à l'échelle vos données dans Azure. Avec Linux, vous pouvez plus facilement déplacer des charges de travail Hadoop existantes dans le cloud et incorporer des composants Big Data supplémentaires qui peuvent être exécutés dans le service. En offrant des clusters Windows et Linux, Microsoft vous permet d'utiliser le système d'exploitation de votre choix pour obtenir des informations à partir des grands volumes de données générés dans le cloud.

*Hadoop et le logo Hadoop sont des marques commerciales de Apache Software Foundation.

Clients utilisant Hadoop dans Azure