Analyse du Big Data et IA avec Apache Spark optimisé
Bénéficiez d’insights à partir de toutes vos données et créez des solutions d’intelligence artificielle (IA) avec Azure Databricks, configurez votre environnement Apache Spark™ en quelques minutes, tirez parti d’une mise à l’échelle automatique et collaborez sur des projets partagés dans un espace de travail interactif. Azure Databricks prend en charge Python, Scala, R, Java et SQL, ainsi que des infrastructures et bibliothèques de science des données telles que TensorFlow, PyTorch et scikit-learn.
Apache Spark™ est une marque commerciale d’Apache Software Foundation.
Ingénierie données fiable
Traitement des données à grande échelle pour les charges de travail de traitement par lot et de diffusion en continu.
Analytiques de toutes vos données
Activez l’analytique pour les données les plus complètes et les plus récentes.
Science des données collaborative
Simplifiez et accélérez la science des données sur les jeux de données volumineux.
Disponible en open source
Environnement Apache Spark rapide et optimisé.
Démarrez rapidement avec un environnement Apache Spark optimisé
Azure Databricks fournit les dernières versions d’Apache Spark et permet une intégration transparente avec des bibliothèques open source. Lancez les clusters et créez rapidement dans un environnement Apache Spark complètement managé grâce à la mise à l’échelle globale et à la disponibilité d’Azure. Les clusters sont installés, configurés et ajustés pour garantir une fiabilité et des performances optimales sans surveillance. Tirez parti de la mise à l’échelle et de l’interruption automatiques pour améliorer le coût total de possession (TCO).
Améliorez votre productivité grâce à un espace de travail partagé et à des langages communs
Collaborez efficacement sur une plateforme ouverte et unifiée pour exécuter tous les types de charges de travail analytiques, que vous soyez un scientifique de données, un ingénieur de données ou un analyste d’entreprise. Créez avec le langage de votre choix, y compris Python, Scala, R et SQL. Contrôlez facilement la version des notebooks avec GitHub et Azure DevOps.
Dynamisez l’apprentissage automatique sur le Big Data
Accédez à des fonctionnalités d’apprentissage automatique avancées et automatisées à l’aide d’Azure Machine Learning intégré pour identifier rapidement les algorithmes et les hyperparamètres appropriés. Simplifiez la gestion, la surveillance et la mise à jour des modèles Machine Learning déployés du cloud vers la périphérie. Azure Machine Learning fournit également un registre central pour vos expériences, pipelines d’apprentissage automatique et modèles.
Bénéficiez d’un entreposage de données moderne haute performance
Combinez des données à n’importe quelle échelle et obtenez des insights grâce à des tableaux de bord analytiques et à des rapports opérationnels. Automatisez le déplacement des données à l’aide d’Azure Data Factory, chargez les données dans Azure Data Lake Storage, transformez-les et nettoyez-les à l’aide d’Azure Databricks, puis mettez-les à disposition à des fins d’analytique à l’aide d’Azure Synapse Analytics. Modernisez votre entrepôt de données dans le cloud pour des niveaux de performance et de scalabilité inégalés.
Principales fonctionnalités du service
-
Moteur Spark optimisé
Traitement de données simple sur l’infrastructure à mise à l’échelle automatique, grâce à une instance Apache Spark™ fortement optimisée pour des gains de performances pouvant être multipliés par 50.
-
Temps d’exécution de l’apprentissage automatique
Accès en un clic à des environnements préconfigurés pour un apprentissage automatique augmenté avec des infrastructures de pointe et populaires telles que PyTorch, TensorFlow et scikit-Learn.
-
MLflow
Suivez et partagez des expériences, reproduisez des exécutions et gérez les modèles de manière collaborative à partir d’un référentiel central.
-
Choix du langage
Recourez à votre langage préféré, notamment Python, Scala, R, Spark SQL et .Net, que vous utilisiez des ressources de calcul serverless ou approvisionnées.
-
Blocs-notes collaboratifs
Affichez et explorez rapidement les données, trouvez et partagez de nouveaux insights et créez des modèles de manière collaborative avec les langages et outils de votre choix.
-
Delta Lake
Intégrez la fiabilité et la scalabilité des données à votre lac de données actuel avec une couche de stockage transactionnel open source conçue pour le cycle de vie complet des données.
-
Intégrations natives avec les services Azure
Enrichissez votre solution d’analytique et d’apprentissage automatique de bout en bout grâce à une forte intégration avec des services Azure comme Azure Data Factory, Azure Data Lake Storage, Azure Machine Learning et Power BI.
-
Espaces de travail interactifs
Activez une collaboration fluide entre experts en mégadonnées, ingénieurs de données et analystes d’affaires.
-
Sécurité de niveau d’entreprise
La sécurité native et fluide garantit la protection de vos données là où elles résident et crée des espaces de travail analytiques conformes, privés et isolés pour des milliers d’utilisateurs et de jeux de données.
-
Prêt pour la production
Exécutez et mettez à l’échelle vos charges de travail de données les plus critiques en toute confiance sur une plateforme de données approuvée, avec des intégrations d’écosystème pour l’intégration continue et livraison continue (CI/CD) et la surveillance.
Apprenez-en davantage en consultant les exemples d’architecture de solution
Science des données et apprentissage automatique avec Azure Databricks
Extrayez des insights des données de diffusion en continu en direct en toute facilité. Capturez des données en continu à partir de n’importe quel appareil IoT ou de journaux de parcours de visite de site web, et traitez-les en quasi-temps réel.
Architecture d’analyse moderne avec Azure Databricks
Convertissez vos données en insights actionnables à l’aide d’outils d’apprentissage automatique de pointe. Cette architecture vous permet de combiner toutes sortes de données, quelle qu’en soit l’échelle, et de construire et déployer des modèles d’apprentissage automatique à grande échelle.
Pipelines d’ingestion, ETL et de traitement de flux avec Azure Databricks
Accélérez et gérez votre cycle de vie d’apprentissage automatique de bout en bout avec Azure Databricks, MLflow et Azure Machine Learning pour créer, partager, déployer et gérer des applications d’apprentissage automatique.
Sécurité et conformité complètes et intégrées
-
Microsoft investit plus de 1 milliard de USD par an dans la recherche et le développement en matière de cybersécurité.
-
Nous employons plus de 3 500 experts de sécurité qui se consacrent à la sécurité et à la protection des données.
-
Azure propose plus de certifications que tout autre fournisseur de services cloud. Voir la liste complète.
Apprenez-en davantage sur les produits et services Azure Databricks
Azure Data Factory
Service d’intégration de données hybride qui simplifie les opérations ETL à grande échelle.
Azure Data Lake Storage Gen 2
Fonctionnalité de lac de données sécurisée et extrêmement évolutive qui repose sur le Stockage Blob Azure.
Azure Machine Learning
Service d’apprentissage automatique de classe Entreprise pour créer et déployer plus rapidement des modèles.
Power BI
Ajoutez des fonctionnalités d’analyse et de création de rapports interactifs à vos applications.
-
Tarification d’Azure Databricks
Lancez rapidement les clusters et bénéficiez d’une mise à l’échelle automatique en fonction de vos besoins. Découvrez toutes les options de tarification d’Azure Databricks.
Commencez avec un compte Azure gratuit
1
2
Lorsque votre crédit est épuisé, passez au paiement à l’utilisation pour continuer à créer des applications à l’aide de ces mêmes services gratuits. Payez uniquement si vous utilisez une quantité supérieure aux volumes mensuels gratuits.
3
Communauté et Support Azure
Posez des questions et bénéficiez de l’aide des ingénieurs Microsoft et des spécialistes de la communauté Azure sur le Forum MSDN et Stack Overflow, ou contactez le Support Azure.
Principaux ateliers et modèles
Découvrez des ateliers auto-rythmés ainsi que les principaux modèles de démarrage rapide liés aux configurations courantes proposés par Microsoft et la communauté.
Explorez les ressources Azure Databricks
Forum aux questions sur Azure Databricks
-
Le contrat de niveau de service (SLA) Azure Databricks garantit une disponibilité de 99,95 %.
-
Une unité Databricks, ou DBU, est une unité de capacité de traitement facturée à la seconde.
-
Une charge de travail d4engineering données est une tâche qui lance et interrompt automatiquement le cluster sur lequel elle s’exécute. Par exemple, une charge de travail peut être déclenchée par le planificateur de travaux Azure Databricks, qui lance un cluster Apache Spark pour le travail et l’interrompt automatiquement une fois le travail effectué.
La charge de travail Analytique données n’est pas automatisée. Par exemple, les commandes des notebooks Azure Databricks s’exécutent sur les clusters Apache Spark jusqu’à leur arrêt manuel. Plusieurs utilisateurs peuvent partager un cluster pour l’analyser ensemble.