Azure Databricks – Injection de réseau virtuel, gestion de version DevOps et disponibilité de Delta

Publié le 13 mars, 2019

Group Product Manager, Azure Data

Azure Databricks constitue une plateforme d’analyse rapide, simple et collaborative, qui s’appuie sur Apache® Spark™ pour accélérer et simplifier le processus d’élaboration de solutions de Big Data et d’IA contribuant au développement de l’entreprise, le tout en respectant des contrats de niveau de service parmi les meilleurs du secteur.

Avec Azure Databricks, vous pouvez configurer votre environnement Spark en quelques minutes et effectuer une mise à l’échelle automatique de manière simple et rapide. Vous pouvez également appliquer vos compétences et collaborer sur des projets partagés dans un espace de travail interactif prenant en charge Python, Scala, R et SQL, ainsi que les infrastructures de science des données et les bibliothèques telles que TensorFlow et PyTorch.

Nous sommes toujours à l’écoute des commentaires des clients et répondons aux questions à mesure que le service évolue. Ce blog présente les annonces importantes relatives au service que nous sommes fiers de proposer à nos clients.

Azure Databricks Delta disponible dans les références (SKU) Standard et Premium

Azure Databricks Delta propose des niveaux de fiabilité et de performance inédits pour les charges de travail de production grâce à de nombreuses améliorations, notamment la pris en charge des transactions, la validation de schéma, l’indexation et le contrôle de version des données.

Depuis l’annonce de la préversion de Delta, nous avons reçu un nombre considérable de commentaires positifs concernant son utilité dans la création de pipelines complexes pour les données par lots et de streaming, et de pipelines ETL simplifiés. Nous avons le plaisir d’annoncer que Delta est désormais disponible dans notre offre Standard en plus de l’offre Premium afin que vous puissiez tirer le maximum de ses fonctionnalités et créer des pipelines de manière plus efficace. Tout le monde peut désormais profiter des avantages de la fiabilité et des performances de Databricks Delta.

Pour en savoir plus sur Azure Databricks Delta, consultez notre guide « Présentation de Databricks Delta », et importez notre bloc-notes de démarrage rapide.

Gestion de version Azure DevOps Services

Azure DevOps est un ensemble de services qui fournissent une solution de bout en bout pour les cinq pratiques centrales de DevOps : planification et suivi, développement, génération et test, livraison, et surveillance et opérations.

Nous avons d’abord mis en place l’intégration de GitHub pour les notebooks Azure Databricks. À la demande générale, nous avons présenté la possibilité de définir votre fournisseur Git pour Azure DevOps Services.

L’authentification avec Azure DevOps Services s’effectue automatiquement lorsque vous vous authentifiez à l’aide d’Azure Active Directory (Azure AD). L’organisation Azure DevOps Services doit être associée au même locataire Azure AD que Databricks. Vous pouvez facilement sélectionner votre fournisseur Git pour Azure DevOps Services en procédant comme le décrit la documentation intitulée « Gestion de version Azure DevOps Services ».

Déployer Azure Databricks dans votre propre réseau virtuel Azure (injection de réseau virtuel) - Préversion

Par défaut, nous déployons et gérons vos clusters dans des réseaux virtuels gérés, avec le Peering activé. Nous créons et gérons ces réseaux virtuels, mais ils résident dans votre abonnement. Nous gérons également les règles de groupe de sécurité réseau associées.

Cependant, une personnalisation peut être nécessaire pour certains clients. Sachez que vous pouvez désormais déployer Azure Databricks dans votre propre réseau virtuel existant (injection de réseau virtuel) si nécessaire. Connectez Azure Databricks à d’autres services Azure tels que Stockage Azure de manière sécurisée à l’aide de points de terminaison de service, ou à des sources de données locales pour les utiliser avec Azure Databricks, en tirant parti des itinéraires définis par l’utilisateur. Vous pouvez également connecter Azure Databricks à une appliance de réseau virtuel pour inspecter tout le trafic sortant et prendre des mesures appropriées pour autoriser et refuser des règles. Configurez Azure Databricks de manière à utiliser un DNS personnalisé et configurez des règles de groupe de sécurité réseau pour spécifier des restrictions de trafic de sortie.

Le déploiement d’Azure Databricks vers votre propre réseau virtuel vous permet également de tirer parti de plages CIDR flexibles. Consultez la documentation pour configurer Azure Databricks dans votre réseau virtuel à l’aide de l’interface utilisateur du portail Azure de manière simple et rapide.

Commencez dès aujourd'hui !

Essayez Azure Databricks dès maintenant et faites-nous part de vos commentaires.