Azure Databricks

Service d’analytique rapide, simple et collaboratif basé sur Apache SparkTM

Analytique Big Data et IA avec Apache Spark

Bénéficiez d'insights à partir de toutes vos données et créez des solutions d'intelligence artificielle (IA) avec Azure Databricks, configurez votre environnement Apache Spark™ en quelques minutes, tirez parti d'une mise à l'échelle automatique et collaborez sur des projets partagés dans un espace de travail interactif. Azure Databricks prend en charge Python, Scala, R, Java et SQL, ainsi que des infrastructures et bibliothèques de science des données telles que TensorFlow, PyTorch et scikit-learn.

Apache Spark™ est une marque commerciale d'Apache Software Foundation.

Ingénierie données fiable

Traitement des données à grande échelle pour les charges de travail Batch et de streaming

Analytiques de toutes vos données

Activez l’analytique pour les données les plus complètes et les plus récentes

Science des données collaborative

Simplifiez et accélérez la science des données sur les jeux de données volumineux

Disponible en open source

Environnement Apache Spark rapide et optimisé

Démarrez rapidement avec un environnement Apache Spark optimisé

Azure Databricks fournit les dernières versions d'Apache Spark et permet une intégration transparente aux bibliothèques open source. Lancez les clusters et créez rapidement dans un environnement Apache Spark complètement managé grâce à la mise à l'échelle globale et à la disponibilité d'Azure. Les clusters sont installés, configurés et ajustés pour garantir une fiabilité et des performances optimales sans surveillance. Tirez parti de la mise à l'échelle et de l'interruption automatiques pour améliorer le coût total de possession (TCO).

Consultez la documentation Azure Databricks

Améliorez votre productivité grâce à un espace de travail partagé et à des langages communs

Collaborez efficacement sur une plateforme ouverte et unifiée pour exécuter tous les types de charges de travail analytiques, que vous soyez un scientifique de données, un ingénieur de données ou un analyste d’entreprise. Créez avec le langage de votre choix, y compris Python, Scala, R et SQL. Contrôlez facilement la version des notebooks avec GitHub et Azure DevOps.

Apprenez à créer un espace de travail Azure Databricks

Machine Learning sur Big Data

Accédez à des fonctionnalités de Machine Learning avancées et automatisées à l'aide d’Azure Machine Learning intégré pour identifier rapidement les algorithmes et les hyperparamètres appropriés. Simplifiez la gestion, la surveillance et la mise à jour des modèles Machine Learning déployés du cloud vers la périphérie. Azure Machine Learning fournit également un registre central pour vos expériences, pipelines Machine Learning et modèles.

Regardez un webinaire consacré à Azure Databricks et Azure Machine Learning

Bénéficiez d'un entreposage de données moderne et performant

Combinez des données à n’importe quelle échelle et obtenez des insights grâce à des tableaux de bord analytiques et à des rapports opérationnels. Automatisez le déplacement des données à l’aide d’Azure Data Factory, chargez les données dans Azure Data Lake Storage, transformez-les et nettoyez-les à l’aide d’Azure Databricks, puis mettez-les à disposition à des fins d’analytique à l’aide d’Azure Synapse Analytics. Modernisez votre entrepôt de données dans le cloud pour des niveaux de performance et d'évolutivité inégalés.

En savoir plus sur l’analytique à l’échelle du cloud sur Azure

Principales fonctionnalités du service

Moteur Spark optimisé

Traitement de données simple sur l’infrastructure à mise à l’échelle automatique, grâce à une instance Apache Spark™ fortement optimisée pour des gains de performances pouvant être multipliés par 50.

Temps d’exécution Machine Learning

Accès en un clic à des environnements Machine Learning préconfigurés pour un Machine Learning augmenté avec des infrastructures de pointe et populaires telles que PyTorch, TensorFlow et scikit-Learn.

MLflow

Suivez et partagez des expériences, reproduisez des exécutions et gérez les modèles de manière collaborative à partir d’un référentiel central.

Choix du langage

Recourez à votre langage préféré, notamment Python, Scala, R, Spark SQL et .Net, que vous utilisiez des ressources de calcul serverless ou provisionnées.

Blocs-notes collaboratifs

Affichez et explorez rapidement les données, trouvez et partagez de nouveaux insights et créez des modèles de manière collaborative avec les langages et les outils de votre choix.

Delta Lake

Intégrez la fiabilité et la scalabilité des données à votre lac de données actuel avec une couche de stockage transactionnel open source conçue pour le cycle de vie complet des données.

Intégrations natives avec les services Azure

Enrichissez votre solution d’analytique et Machine Learning de bout en bout avec une forte intégration avec les services Azure, tels que Azure Data Factory, Azure Data Lake Storage, Azure Machine Learning et Power BI.

Espaces de travail interactifs

Activez une collaboration fluide entre experts en mégadonnées, ingénieurs de données et analystes d’affaires.

Sécurité de niveau d’entreprise

La sécurité native et fluide garantit la protection de vos données là où elles résident et crée des espaces de travail analytiques conformes, privés et isolés pour des milliers d’utilisateurs et de jeux de données.

Prêt pour la production

Exécutez et mettez à l’échelle vos charges de travail de données les plus critiques en toute confiance sur une plateforme de données de confiance, avec des intégrations d’écosystème pour CI/CD et la supervision.

En savoir plus en consultant les exemples d’architecture de solution

Une analytique en temps réel sur nue architecture Big Data

Extrayez des insights des données de streaming en direct en toute facilité. Capturez des données en continu à partir de n’importe quel appareil IoT ou de journaux de parcours de visite de site web, et traitez-les en temps quasi réel.

Architecture de l’analytique avancée

Convertissez vos données en insights actionnables à l’aide d’outils Machine Learning d’une qualité exceptionnelle. Cette architecture vous permet de combiner toutes sortes de données, quelle qu’en soit l’échelle, et de construire et déployer des modèles d’apprentissage automatique à grande échelle.

Gestion du cycle de vie Machine Learning

Accélérez et gérez votre cycle de vie Machine Learning de bout en bout avec Azure Databricks, MLflow et Azure Machine Learning pour créer, partager, déployer et gérer des applications Machine Learning.

La sécurité et la confidentialité des données ne sont pas négociables

  • Sécurisez, surveillez et gérez vos solutions de données et d’analytique avec un large éventail de fonctions de sécurité et de conformité.

  • Utilisez l’authentification unique et l’intégration Azure Active Directory pour permettre aux professionnels des données de consacrer plus de temps à la découverte d’insights.

  • Azure a  plus de certifications que tout autre fournisseur de services cloud. Consultez la liste complète.

Apprenez-en plus sur les produits et services Azure Databricks

Tarification d'Azure Databricks

Approuvé par des entreprises de tous secteurs

Identifier les risques pour la sécurité à l'aide du Deep Learning basé sur le cloud

Shell utilise Azure, l'IA et la vision industrielle pour mieux protéger ses clients et ses employés.

Shell

Accélérer les performances et réduire les coûts

Service de données : renewablesAI utilise Azure et Apache Spark pour créer un marché de l'énergie solaire stable et rentable.

Renewables AI

Activation d'une solution d'analyse de bout en bout dans Azure

Le prestataire logistique LINX Cargo Care Group encourage l'innovation à l'échelle de l'entreprise à l'aide d'Azure Databricks.

LINX Cargo Care Group

Prise en main d'Azure Databricks

Ouvrez un compte Azure gratuit pour bénéficier d'un accès instantané.

Lisez la documentation pour apprendre à utiliser Azure Databricks.

Explorez le guide de démarrage rapide pour créer un cluster, un notebook, une table, etc.

Communauté et support Azure

Posez des questions et bénéficiez de l'aide des ingénieurs Microsoft et des spécialistes de la communauté Azure sur le Forum MSDN et Stack Overflow, ou contactez le support Azure.

Principaux ateliers et modèles

Découvrez des ateliers auto-rythmés ainsi que les principaux modèles de démarrage rapide liés aux configurations courantes proposés par Microsoft et la communauté.

Accédez aux actualités et ressources les plus récentes en lien avec Azure Databricks

Mises à jour, blogs et annonces relatifs à Databricks

Forum aux questions sur Azure Databricks

  • Le contrat de niveau de service (SLA) Azure Databricks garantit une disponibilité de 99,95 %.
  • Une unité Databricks, ou DBU, est une unité de capabilité de processus facturée à la seconde.
  • La charge de travail Engineering données est un travail qui lance et interrompt automatiquement le cluster sur lequel il s'exécute. Par exemple, une charge de travail peut être déclenchée par le planificateur de travaux Azure Databricks, qui lance un cluster Apache Spark pour le travail et l'interrompt automatiquement une fois le travail effectué.
    La charge de travail Analytique données n'est pas automatisée. Par exemple, les commandes des notebooks Azure Databricks s'exécutent sur les clusters Apache Spark jusqu'à ce qu'elles soient manuellement interrompues. Différents utilisateurs peuvent partager un cluster pour l'analyser collectivement.

Créer votre compte gratuit Azure