Azure Machine Learning – Le ML pour tous les niveaux de compétence

Publié le 5 novembre, 2019

Group Program Manager, Microsoft Azure

Les entreprises d’aujourd’hui adoptent rapidement l’intelligence artificielle pour garder une longueur d’avance sur la concurrence, innover, améliorer l’expérience client et augmenter leurs revenus. Les applications d’intelligence artificielle et d’apprentissage automatique ouvrent une nouvelle ère de transformation dans différents domaines, des compétences à l’échelle, en passant par l’efficacité, les opérations et la gouvernance.

Microsoft Azure Machine Learning fournit des fonctionnalités de classe Entreprise pour accélérer le cycle de vie du Azure Machine Learning, et permet aux développeurs et aux scientifiques des données de tous niveaux de créer, former, déployer et gérer des modèles de manière responsable et à grande échelle. Dans le cadre de Microsoft Ignite, nous annonçons plusieurs avancées majeures d’Azure Machine Learning dans les domaines suivants :

  • Nouvelle expérience web de Studio qui accroît la productivité de l’apprentissage automatique pour les développeurs et les scientifiques des données de tous niveaux, avec des options de création flexibles allant du glisser-déposer sans code au Machine Learning automatisé en passant par le développement Code First.
  • Nouvelles fonctionnalités d’opérations de Machine Learning (MLOps) de pointe pour la gestion du cycle de vie du Machine Learning, permettant aux équipes informatiques et de science des données d’innover plus rapidement.
  • Nouvelles fonctionnalités ouvertes et interopérables offrant choix et flexibilité au travers de la prise en charge de R, d’Azure Synapse Analytics, d’Azure Open Datasets, d’ONNX et d’autres infrastructures, langages et outils appréciés.
  • Nouvelles fonctionnalités de sécurité et de gouvernance, dont le contrôle d’accès en fonction du rôle (RBAC), le Réseau virtuel Microsoft Azure (VNet), la gestion de la capacité, et des fonctionnalités d’impartialité et d’interprétabilité de l’intelligence artificielle de pointe et responsables.

Examinons ces annonces en détail pour voir comment Azure Machine Learning aide les personnes, les équipes et les organisations à atteindre, voire à dépasser leurs objectifs.

Accédez à l’apprentissage automatique pour tous les niveaux de compétence et augmentez votre productivité

« En améliorant les prévisions avec le ML automatisé par Azure Machine Learning, nous pouvons réduire les déchets et garantir la disponibilité des pizzas sont prêtes pour nos clients. Cela réduit les approximations de nos opérateurs et leur permet de se concentrer davantage sur d’autres aspects des opérations des magasins. Plutôt que de deviner le nombre de pizzas à préparer, les opérateurs veillent à ce que chaque expérience client soit excellente. » – Anita Klopfenstein, PDG de Little Caesars Pizza. 

La nouvelle expérience web de Studio (actuellement en préversion) permet aux scientifiques et ingénieurs des données de tous niveaux de compétences d’effectuer des tâches de Machine Learning de bout en bout, dont la préparation des données, la formation de modèles, le déploiement et la gestion de manière transparente. Choisissez entre trois options de création différentes en fonction de vos compétences et préférences (conception par glisser-déplacer sans code, Machine Learning automatisé ou expérience de notebooks Code First. Accédez aux ressources Azure Machine Learning (dont des jeux de données et des modèles) et à des fonctionnalités riches (dont la dérive, la surveillance, l’étiquetage des données, etc.), le tout à partir d’un emplacement unique.

 

La nouvelle expérience web de Studio permet d’accéder à toutes les tâches du cycle de vie de Machine Learning dans un seul volet.

Expérience web de Studio

Le Concepteur (actuellement en préversion) fournit des flux de travail par glisser-déplacer afin de simplifier le processus de création, de test et de déploiement de modèles de Machine Learning à l’aide d’une expérience visuelle. Les clients qui utilisent actuellement la version classique d’Azure Machine Learning Studio sont invités à essayer le Concepteur pour bénéficier de l’échelle et de la sécurité d’Azure Machine Learning.

L’interface utilisateur de Machine Learning automatisé (actuellement en préversion) aide les informaticiens à créer des modèles sans écrire une seule ligne de code. Automatisez les tâches laborieuses d’ingénierie de fonctionnalité, de sélection d’algorithme et de balayage d’hyperparamètre, puis opérationnalisez votre modèle en quelques clics.

Les notebooks (actuellement en préversion) constituent une solution entièrement managée pour les développeurs et les scientifiques des données, destinée à les aider à se familiariser facilement avec le Machine Learning en mettant à leur disposition des environnements personnalisés préconfigurés qui éliminent le temps de configuration, tout en offrant aux administrateurs informatiques des capacités de gestion et de préparation.

Nouvel étiquetage des données (actuellement en préversion). Des données étiquetées de haute qualité sont essentielles pour la création de modèles de haute précision pour un apprentissage supervisé. Les équipes peuvent désormais gérer des projets d’étiquetage de données de manière transparente dans l’expérience web de Studio pour des étiquettes contre des données, accélérant ainsi le processus laborieux d’étiquetage manuel. Les tâches d’étiquetage prises en charge incluent la détection d’objet, la classification d’images multiclasse et la classification d’images à plusieurs étiquettes.

Opérationnalisez à grande échelle avec les opérations de Machine Learning (MLOps) de pointe

Azure Machine Learning dispose de fonctionnalités MLOps intégrées pour la gestion du cycle de vie de Machine Learning de classe Entreprise, qui permettent aux équipes de science des données et informatiques de collaborer et d’accélérer le développement et le déploiement de modèles.

« TransLink a su tirer parti des MLOps dans Azure Machine Learning pour créer et gérer des modèles, et les déployer en production. Cela a contribué à augmenter l’efficacité et la transparence lorsque nous avons transféré plus de 16 000 modèles Machine Learning de la phase pilote à la production. En fin de compte, les clients de TransLink ont ​​bénéficié d’un gain de 74 % entre les heures de départ de bus prévues et les heures réelles. Ils peuvent ainsi leur planifier leur voyage sur le réseau de bus de TransLink. »- Sze-Wan Ng, directeur Analytique & développement, Translink.

Nouvelles mises à jour pour construire des modèles reproductibles et assurer la gouvernance et le contrôle du Machine Learning

Les jeux de données aident les scientifiques des données et ingénieurs en Machine Learning à accéder facilement aux données d’un certain nombre de services de Stockage Azure, à appliquer rapidement les jeux de données, à les réutiliser efficacement pour diverses tâches et à suivre automatiquement la traçabilité des données. Des jeux de données et registres de modèles riches permettent de suivre les ressources et les informations pour opérationnaliser efficacement les modèles et simplifier les flux de travail, de l’apprentissage à l’inférence. Le contrôle de version permet de suivre et de gérer les ressources en offrant une traçabilité améliorée et en aidant à la création de pipelines reproductibles pour une livraison de modèle cohérente. Les fonctionnalités de piste d’audit garantissent l’intégrité des ressources et fournissent des journaux de contrôle permettant de répondre aux exigences réglementaires.

Nouvelles mises à jour pour déployer facilement des modèles et gérer efficacement le cycle de vie de Machine Learning

L’inférence de lot contribue à augmenter la productivité et à réduire les coûts en générant des prévisions sur des téraoctets de données structurées ou non. Le déploiement contrôlé permet le déploiement de différentes versions de modèle sous un point de terminaison de scoring commun, afin d’implémenter un pipeline de déploiement sophistiqué et de publier des modèles en toute confiance. La surveillance de la dérive de données permet de maintenir la précision du modèle en détectant des problèmes de performances de celui-ci dus à des modifications apportées aux données d’entrée du modèle au fil du temps. L’analyse de la dérive comprend l’ampleur de celle-ci, la contribution par fonctionnalité et d’autres informations permettant de prendre des mesures appropriées, telles que le réentraînement du modèle.

 

Les fonctionnalités de MLOps, telles que les visualisations de la dérive des données fournissent des métriques telles que l’ampleur de la dérive qui augmente au fil du temps, et contribuent à la dérive dans l’expérience web de Studio.

Supervision de la dérive des données

Innovez en utilisant des fonctionnalités ouvertes et interopérables

Avec Azure Machine Learning, les développeurs et les scientifiques des données peuvent accéder à la prise en charge intégrée d’outils et d’infrastructures open source tels que PyTorch, TensorFlow et scikit-learn, ou du format ONNX ouvert et interopérable. Nous prenons désormais en charge ONNX (Open Neural Network Exchange), le standard ouvert pour la représentation du Machine Learning. Avec la nouvelle version v1.0 , le runtime ONNX propose des API Python stables pouvant être utilisées dans Azure Machine Learning tant sur le processeur et que sur le processeur graphique.

Les nouvelles fonctionnalités basées sur R permettent aux scientifiques des données d’exécuter des travaux R sur Azure Machine Learning, puis de gérer et déployer des modèles R en tant que services web. Les scientifiques des données peuvent choisir leur environnement de développement : accès en un clic au développement intégré au navigateur (IDE) de RStudio Server (édition open source) ou à Jupyter avec R.

Azure Synapse Analytics est à présent entièrement intégré avec Azure Machine Learning, ce qui étend considérablement la découverte d’insights à partir de toutes vos données et permet d’appliquer des modèles Machine Learning à toutes vos applications intelligentes.

La plateforme Azure Open Datasets est désormais généralement disponible et fournit des jeux de données organisés, hébergés sur Azure et facilement accessibles depuis les espaces de travail d’Azure Machine Learning pour accélérer l’apprentissage des modèles. Plus de 25 jeux de données sont maintenant disponibles, dont des données socio-économiques, des images satellitaires, et bien plus. De nouveaux jeux de données sont ajoutés en permanence et vous pouvez nommer des jeux de données supplémentaires pour Azure.

Appuyez-vous sur une base sécurisée

« Avec Azure Machine Learning, nos équipes de scientifiques des données peuvent travailler dans un environnement pris en charge avec la confiance et la conformité aux normes de l’industrie. Des fonctionnalités de préparation d’entreprise telles que le réseau virtuel RBAC et Key Vault nous permettent d’exercer un contrôle précis sur nos ressources, et de livrer des innovations sur une plateforme sécurisée qui améliore la productivité de sorte que les équipes peuvent se concentrer sur les tâches de Machine Learning plutôt que sur l’infrastructure et la configuration. » – Cary Goltermann, Responsable, Ignition Tax, KPMG LLP.

Mises à jour de sécurité et de préparation pour l’entreprise

La gestion de la capacité de l’espace de travail (actuellement en préversion) aide les administrateurs à analyser l’utilisation du calcul dans les espaces de travail et clusters d’un abonnement pour une distribution efficace des ressources. Des limites de capacité peuvent être définies pour réaffecter des ressources à la gestion et à la gouvernance de la capacité. Le Contrôle d’accès en fonction du rôle, ou RBAC, (en préversion) permet de définir des rôles personnalisés pour un contrôle d’accès granulaire, et prend en charge des scénarios de sécurité avancés. Le réseau virtuel, ou VNet, (en préversion) fournit une limite de sécurité pour isoler les ressources de calcul utilisées pour former et déployer des modèles lors de l’exécution d’expérimentations via l’inférence.

Impartialité : En plus de l’interprétabilité du modèle dans Azure Machine Learning, qui prend en charge la transparence et la compréhension du modèle, les scientifiques des données et les développeurs peuvent désormais tirer parti de Fairlearn, le nouvel outil open source d’évaluation et prévention pour l’impartialité. Cet outil aide les organisations à découvrir des insights sur l’impartialité des prévisions de leur modèle grâce à un ensemble intuitif et configurable de visualisations.

 

Les fonctionnalités d’impartialité permettent de découvrir des insights sur l’impartialité du modèle, comme la visualisation, qui révèle la disparité des prévisions entre les sous-groupes dans ce cas basé sur le genre.

Insights de caractéristique d’impartialité

Commencez à créer dès aujourd’hui

Nous sommes ravis de vous proposer ces fonctionnalités afin d’accélérer le cycle de vie du Machine Learning, des nouvelles expériences de productivité rendant le Machine Learning accessible à tous les niveaux de compétence, aux robustes MLOps et à la sécurité de classe Entreprise, basés sur une plateforme ouverte et fiable. Nous nous engageons à continuer d’investir dans le Machine Learning pour soutenir votre entreprise et vos applications, et vous aider à transformer votre entreprise avec l’IA.


Azure. Inventez en ayant un but.