Passer au contenu principal

Azure Databricks

Concevez l’IA avec une analyse basée sur Apache Spark™.

Analyse du Big Data et IA avec Apache Spark optimisé

Bénéficiez d’insights à partir de toutes vos données et créez des solutions d’intelligence artificielle (IA) avec Azure Databricks, configurez votre environnement Apache Spark™ en quelques minutes, tirez parti d’une mise à l’échelle automatique et collaborez sur des projets partagés dans un espace de travail interactif. Azure Databricks prend en charge Python, Scala, R, Java et SQL, ainsi que des infrastructures et bibliothèques de science des données telles que TensorFlow, PyTorch et scikit-learn.

Apache Spark™ est une marque commerciale d’Apache Software Foundation.

Ingérez et orchestrez les données avec Azure Data Factory. Préparez, transformez et enrichissez les données avec Azure Databricks. Servez les données avec Azure Synapse Analytics. Stockez les données avec Azure Data Lake Storage. Visualisez les données avec Power BI.

Ingénierie données fiable

Traitement des données à grande échelle pour les charges de travail de traitement par lot et de diffusion en continu.

Analytiques de toutes vos données

Activez l’analytique pour les données les plus complètes et les plus récentes.

Science des données collaborative

Simplifiez et accélérez la science des données sur les jeux de données volumineux.

Disponible en open source

Environnement Apache Spark rapide et optimisé.

Démarrez rapidement avec un environnement Apache Spark optimisé

Azure Databricks fournit les dernières versions d’Apache Spark et permet une intégration transparente avec des bibliothèques open source. Lancez les clusters et créez rapidement dans un environnement Apache Spark complètement managé grâce à la mise à l’échelle globale et à la disponibilité d’Azure. Les clusters sont installés, configurés et ajustés pour garantir une fiabilité et des performances optimales sans surveillance. Tirez parti de la mise à l’échelle et de l’interruption automatiques pour améliorer le coût total de possession (TCO).
Utilisateur en train de créer un cluster dans Azure Databricks.
Présentation d’Apache Spark sur Databricks

Améliorez votre productivité grâce à un espace de travail partagé et à des langages communs

Collaborez efficacement sur une plateforme ouverte et unifiée pour exécuter tous les types de charges de travail analytiques, que vous soyez un scientifique de données, un ingénieur de données ou un analyste d’entreprise. Créez avec le langage de votre choix, y compris Python, Scala, R et SQL. Contrôlez facilement la version des notebooks avec GitHub et Azure DevOps.

Dynamisez l’apprentissage automatique sur le Big Data

Accédez à des fonctionnalités d’apprentissage automatique avancées et automatisées à l’aide d’Azure Machine Learning intégré pour identifier rapidement les algorithmes et les hyperparamètres appropriés. Simplifiez la gestion, la surveillance et la mise à jour des modèles Machine Learning déployés du cloud vers la périphérie. Azure Machine Learning fournit également un registre central pour vos expériences, pipelines d’apprentissage automatique et modèles.
Espace de travail intitulé Modèle ML avec Scikit-Learn dans Azure Databricks
Prévision de demande de mise à l’échelle dans Azure Databricks.

Bénéficiez d’un entreposage de données moderne haute performance

Combinez des données à n’importe quelle échelle et obtenez des insights grâce à des tableaux de bord analytiques et à des rapports opérationnels. Automatisez le déplacement des données à l’aide d’Azure Data Factory, chargez les données dans Azure Data Lake Storage, transformez-les et nettoyez-les à l’aide d’Azure Databricks, puis mettez-les à disposition à des fins d’analytique à l’aide d’Azure Synapse Analytics. Modernisez votre entrepôt de données dans le cloud pour des niveaux de performance et de scalabilité inégalés.

Principales fonctionnalités du service

  • a

    Moteur Spark optimisé

    Traitement de données simple sur l’infrastructure à mise à l’échelle automatique, grâce à une instance Apache Spark™ fortement optimisée pour des gains de performances pouvant être multipliés par 50.

  • a

    Temps d’exécution de l’apprentissage automatique

    Accès en un clic à des environnements préconfigurés pour un apprentissage automatique augmenté avec des infrastructures de pointe et populaires telles que PyTorch, TensorFlow et scikit-Learn.

  • a

    MLflow

    Suivez et partagez des expériences, reproduisez des exécutions et gérez les modèles de manière collaborative à partir d’un référentiel central.

  • c

    Choix du langage

    Recourez à votre langage préféré, notamment Python, Scala, R, Spark SQL et .Net, que vous utilisiez des ressources de calcul serverless ou approvisionnées.

  • c

    Blocs-notes collaboratifs

    Affichez et explorez rapidement les données, trouvez et partagez de nouveaux insights et créez des modèles de manière collaborative avec les langages et outils de votre choix.

  • c

    Delta Lake

    Intégrez la fiabilité et la scalabilité des données à votre lac de données actuel avec une couche de stockage transactionnel open source conçue pour le cycle de vie complet des données.

  • v

    Intégrations natives avec les services Azure

    Enrichissez votre solution d’analytique et d’apprentissage automatique de bout en bout grâce à une forte intégration avec des services Azure comme Azure Data Factory, Azure Data Lake Storage, Azure Machine Learning et Power BI.

  • SPAR

    Espaces de travail interactifs

    Activez une collaboration fluide entre experts en mégadonnées, ingénieurs de données et analystes d’affaires.

  • d

    Sécurité de niveau d’entreprise

    La sécurité native et fluide garantit la protection de vos données là où elles résident et crée des espaces de travail analytiques conformes, privés et isolés pour des milliers d’utilisateurs et de jeux de données.

  • s

    Prêt pour la production

    Exécutez et mettez à l’échelle vos charges de travail de données les plus critiques en toute confiance sur une plateforme de données approuvée, avec des intégrations d’écosystème pour l’intégration continue et livraison continue (CI/CD) et la surveillance.

Apprenez-en davantage en consultant les exemples d’architecture de solution

Science des données et apprentissage automatique avec Azure Databricks

Extrayez des insights des données de diffusion en continu en direct en toute facilité. Capturez des données en continu à partir de n’importe quel appareil IoT ou de journaux de parcours de visite de site web, et traitez-les en quasi-temps réel.

Architecture d’analyse moderne avec Azure Databricks

Convertissez vos données en insights actionnables à l’aide d’outils d’apprentissage automatique de pointe. Cette architecture vous permet de combiner toutes sortes de données, quelle qu’en soit l’échelle, et de construire et déployer des modèles d’apprentissage automatique à grande échelle.

Pipelines d’ingestion, ETL et de traitement de flux avec Azure Databricks

Accélérez et gérez votre cycle de vie d’apprentissage automatique de bout en bout avec Azure Databricks, MLflow et Azure Machine Learning pour créer, partager, déployer et gérer des applications d’apprentissage automatique.

Sécurité et conformité complètes et intégrées

  • Microsoft investit plus de 1 milliard de USD par an dans la recherche et le développement en matière de cybersécurité.

  • Nous employons plus de 3 500 experts de sécurité qui se consacrent à la sécurité et à la protection des données.

  • Azure propose plus de certifications que tout autre fournisseur de services cloud. Voir la liste complète.

Apprenez-en davantage sur les produits et services Azure Databricks

Azure Data Factory

Service d’intégration de données hybride qui simplifie les opérations ETL à grande échelle.

Azure Data Lake Storage Gen 2

Fonctionnalité de lac de données sécurisée et extrêmement évolutive qui repose sur le Stockage Blob Azure.

Azure Machine Learning

Service d’apprentissage automatique de classe Entreprise pour créer et déployer plus rapidement des modèles.

Power BI

Ajoutez des fonctionnalités d’analyse et de création de rapports interactifs à vos applications.

  • Tarification d’Azure Databricks

    Lancez rapidement les clusters et bénéficiez d’une mise à l’échelle automatique en fonction de vos besoins. Découvrez toutes les options de tarification d’Azure Databricks.

Commencez avec un compte Azure gratuit

1

Essai gratuit. Recevez un crédit de 200 USD à utiliser dans un délai de 30 jours. Pendant que vous disposez de votre crédit, bénéficiez de volumes gratuits de nombreux services populaires et accédez à plus de 55 autres services toujours gratuits.

2

Lorsque votre crédit est épuisé, passez au paiement à l’utilisation pour continuer à créer des applications à l’aide de ces mêmes services gratuits. Payez uniquement si vous utilisez une quantité supérieure aux volumes mensuels gratuits.

3

Au bout de 12 mois, vous continuerez à bénéficier de plus de 55 services gratuits, tout en payant uniquement ce que vous utilisez au-delà de vos volumes mensuels gratuits.

Communauté et Support Azure

Posez des questions et bénéficiez de l’aide des ingénieurs Microsoft et des spécialistes de la communauté Azure sur le Forum MSDN et Stack Overflow, ou contactez le Support Azure.

Principaux ateliers et modèles

Découvrez des ateliers auto-rythmés ainsi que les principaux modèles de démarrage rapide liés aux configurations courantes proposés par Microsoft et la communauté.

Forum aux questions sur Azure Databricks

  • Le contrat de niveau de service (SLA) Azure Databricks garantit une disponibilité de 99,95 %.

  • Une unité Databricks, ou DBU, est une unité de capacité de traitement facturée à la seconde.

  • Une charge de travail d4engineering données est une tâche qui lance et interrompt automatiquement le cluster sur lequel elle s’exécute. Par exemple, une charge de travail peut être déclenchée par le planificateur de travaux Azure Databricks, qui lance un cluster Apache Spark pour le travail et l’interrompt automatiquement une fois le travail effectué.

    La charge de travail Analytique données n’est pas automatisée. Par exemple, les commandes des notebooks Azure Databricks s’exécutent sur les clusters Apache Spark jusqu’à leur arrêt manuel. Plusieurs utilisateurs peuvent partager un cluster pour l’analyser ensemble.

Si vous êtes prêt, créons votre compte Azure gratuit

Essayez Azure gratuitement

Chattez avec le service commercial