Azure Databricks - De nouvelles fonctionnalités à un coût inférieur

Publié le 6 mars, 2019

Group Product Manager, Azure Data

Azure Databricks fournit une plateforme d’analytique rapide, simple et collaborative, qui s’appuie sur Apache Spark™ pour accélérer et simplifier le processus d’élaboration de solutions de Big Data et d’IA qui sont associées aux contrats SLA parmi les meilleurs du secteur.

Avec Azure Databricks, les clients peuvent configurer un environnement Apache Spark optimisé en quelques minutes. Les scientifiques des données et les ingénieurs de données peuvent collaborer en utilisant un espace de travail interactif avec les langages et les outils de leur choix. L’intégration native avec Azure Active Directory (Azure AD) et d’autres services Azure permet aux clients de créer des solutions modernes et de bout en bout d’entrepôt de données, de Machine Learning et d’analytique en temps réel.

Azure Databricks a été adopté massivement et nous sommes ravis d’annoncer les nouvelles fonctionnalités que nous mettons sur le marché.

Disponibilité générale de Data Engineering Light

Les clients peuvent à présent utiliser Azure Databricks avec une nouvelle charge de travail peu coûteuse, appelée Data Engineering Light, qui leur permet d’exécuter des applications de traitement par lots sur une instance Apache Spark managée. Celle-ci est conçue pour des charges de travail simples et non critiques qui n’ont pas besoin des performances, de la mise à l’échelle automatique et des autres avantages offerts par les charges de travail Engineering données et Analytique données. Commencez à utiliser cette nouvelle charge de travail.

De plus, nous avons réduit le prix de la charge de travail Ingénierie données au sein des références SKU Standard et Premium. Les deux références SKU sont maintenant disponibles à un coût inférieur de 25 %. Pour consulter la nouvelle tarification des références SKU Azure Databricks, visitez cette page.

Préversion de MLflow en mode managé

MLflow est une infrastructure open source permettant de gérer le cycle de vie Machine Learning. Avec MLflow en mode managé, les clients peuvent y accéder de manière native à partir de leur environnement Azure Databricks et utiliser Azure Active Directory pour l’authentification. Avec MLflow en mode managé sur Azure Databricks, les clients peuvent :

  • Suivre les expériences en enregistrant automatiquement les paramètres, les résultats, le code et les données sur un serveur de suivi MLflow hébergé et prêt à l’emploi. Les cycles peuvent maintenant être organisés en expériences à partir d’Azure Databricks et les résultats peuvent être interrogés à partir des notebooks Azure Databricks afin d’identifier les modèles les plus performants.
  • Intégrer dans un package le code Machine Learning et les dépendances localement dans un format de projet reproductible et exécuter celui-ci à distance sur un cluster Databricks.
  • Déployer rapidement des modèles en production.

En savoir plus sur MLFlow en mode managé.

Machine Learning sur Azure avec Azure Machine Learning et Azure Databricks

Depuis la disponibilité générale du service Azure Machine Learning (AML) en décembre 2018 et son intégration à Azure Databricks, nous avons reçu des réactions extrêmement positives de la part des clients qui utilisent cette combinaison pour accélérer les opérations Machine Learning sur le Big Data. Voici en quoi Azure Machine Learning complète l’expérience Azure Databricks :

  • Activation de la fonctionnalité Machine Learning automatisée qui permet aux scientifiques des données de tous niveaux d’identifier plus rapidement les algorithmes et les hyperparamètres appropriés.
  • Activation de DevOps pour le Machine Learning, ce qui simplifie la gestion, la surveillance et la mise à jour des modèles Machine Learning.
  • Déploiement de modèles à partir du cloud et de la périphérie.
  • Fourniture d’un registre central pour les expériences, les pipelines Machine Learning et les modèles créés dans l’ensemble de l’organisation.

La combinaison de Azure Databricks et Azure Machine Learning fait d’Azure le meilleur cloud pour le Machine Learning. Les clients bénéficient d’un environnement optimisé basé sur Apache Spark et à mise à l’échelle automatique, d’un espace de travail collaboratif, d’opérations Machine Learning automatisées et d’une gestion du cycle de vie Machine Learning de bout en bout.

Workflow Machine Learning sur Azure

Commencez dès aujourd'hui !

Essayez Azure Databricks dès maintenant et faites-nous part de vos commentaires.