Azure Machine Learning – maschinelles Lernen mit jedem Kenntnisstand

Veröffentlicht am 5 November, 2019

Group Program Manager, Microsoft Azure

Unternehmen führen künstliche Intelligenz (KI) mit zunehmender Geschwindigkeit ein, um konkurrenzfähig und innovativ zu bleiben, das Kundenerlebnis zu verbessern und die Einnahmen zu steigern. Anwendungen für KI und maschinelles Lernen leiten eine neue Zeit der Transformation in allen Branchen ein, die Qualifikationen ebenso betrifft wie Skalierung, Effizienz, Betrieb und Governance.

Microsoft Azure Machine Learning bietet Funktionen auf Enterpriseniveau für einen schnelleren Lebenszyklus beim maschinellen Lernen und gibt Entwicklern und Data Scientists aller Kenntnisstufen die Möglichkeit an die Hand, Modelle verantwortungsbewusst und in der gewünschten Größenordnung zu erstellen, zu trainieren, bereitzustellen und zu verwalten. Auf der Microsoft Ignite geben wir mehrere große Fortschritte bei Azure Machine Learning in den folgenden Bereichen bekannt:

  • Neue Studio-Weboberfläche zum Steigern der Produktivität mit maschinellem Lernen für Entwickler und Data Scientists aller Kenntnisstände – mit flexiblen Erstellungsoptionen von codefreier Drag & Drop-Bearbeitung und automatisiertem maschinellem Lernen bis hin zur Code First-Entwicklung.
  • Neue branchenführende MLOps-Funktionen (Machine Learning Operations) zur Verwaltung des Lebenszyklus beim maschinellen Lernen, sodass Data Science- und IT-Teams ihre Innovationen schneller umsetzen können.
  • Neue offene und interoperable Funktionen für mehr Auswahl und Flexibilität mit Unterstützung für R, Azure Synapse Analytics, Azure Open Datasets, ONNX und andere verbreitete Frameworks, Sprachen und Tools.
  • Neue Sicherheit- und Governancefeatures, einschließlich rollenbasierter Zugriffssteuerung, Azure Virtual Network (VNET), Kapazitätsverwaltung und hochmodernen Funktionen für KI-Interpretierbarkeit und Unvoreingenommenheit.

Wir besprechen diese Ankündigungen nun ausführlich, um zu erläutern, wie Azure Machine Learning Einzelpersonen, Teams und Organisationen dabei hilft, Geschäftsziele zu erfüllen und zu übertreffen.

Zugriff auf maschinelles Lernen mit jedem Kenntnisstand und Steigern der Produktivität

„Durch Verbesserungen der Vorhersagen mit automatisiertem maschinellem Lernen in Azure Machine Learning können wir unseren Abfall verringern und dafür sorgen, dass die Pizzas bereits auf unsere Kunden warten. Unsere Betreiber müssen weniger raten und können mehr Zeit mit anderen Aspekten des Filialbetriebs verbringen. Anstatt zu schätzen, wie viele Pizzas bereitstehen müssen, konzentrieren die Filialbetreiber sich darauf, den Kunden immer ein hervorragendes Erlebnis zu bieten.“ – Anita Klopfenstein, CEO, Little Caesars Pizza.

Die neue Studio-Weboberfläche (zurzeit in der Vorschauphase) ermöglicht Data Scientists und Datentechnikern mit jedem Kenntnisstand, komplette Aufgaben mit maschinellem Lernen nahtlos abzuschließen, einschließlich Datenaufbereitung, Modelltraining, Bereitstellung und Verwaltung. Wählen Sie anhand Ihrer Vorkenntnisse und Ihrer Vorlieben zwischen drei unterschiedlichen Erstellungsoptionen aus – dem codefreien Drag & Drop-Designer, automatisiertem maschinellem Lernen oder der Code First-Erfahrung mit Notebooks. Greifen Sie von einem zentralen Ort aus auf Azure Machine Learning-Ressourcen (einschließlich Datasets und Modellen) und umfangreiche Funktionen (einschließlich Datendrift, Überwachung, Bezeichnung u. v. m.) zu.

 

Die neue Studio-Weboberfläche bietet Zugriff auf alle Aufgaben im Lebenszyklus des maschinellen Lernens in einem einzigen Bereich.

Studio-Weboberfläche

Designer (derzeit in der Vorschauphase) mit Drag & Drop-Workflows zur Vereinfachung des Erstellens, Testens und Bereitstellens von Machine Learning-Modellen auf einer visuellen Oberfläche. Kunden, die derzeit die klassische Version von Azure Machine Learning Studio nutzen, sollten Designer ausprobieren, um die Skalierbarkeit und Sicherheit von Azure Machine Learning nutzen zu können.

Die Benutzeroberfläche für automatisiertes maschinelles Lernen (derzeit in der Vorschauphase) hilft Data Scientists dabei, Modelle zu erstellen, ohne eine einzige Codezeile schreiben zu müssen. Automatisieren Sie die zeitintensiven Aufgaben der Featureentwicklung, der Algorithmusauswahl und des Hyperparametersweeping, und operationalisieren Sie dann Ihr Modell mit nur wenigen Mausklicks.

Notebooks (derzeit in der Vorschauphase) sind eine vollständig verwaltete Lösung, mit der Entwickler und Data Scientists ganz einfach ihre ersten Schritte mit maschinellem Lernen machen können. Mit den vorkonfigurierten benutzerdefinierten Umgebungen entfällt die Einrichtungszeit, und IT-Administratoren erhalten Funktionen für Verwaltung und den direkten Einsatz im Unternehmen.

Neue Datenbezeichnung (derzeit in der Vorschauphase). Hochwertige Datenbezeichnungen sind für die Erstellung hoch präziser Modelle für beaufsichtigtes Lernen ausschlaggebend. Teams können nun Datenbezeichnungsprojekte nahtlos in der Studio-Weboberfläche verwalten, um Bezeichnungen für Daten zu erhalten und dabei gegenüber der zeitaufwendigen manuellen Bezeichnung Zeit zu sparen. Zu den unterstützten Bezeichnungsaufgaben gehören Objekterkennung, Bildklassifizierung mit mehreren Klassen und Bildklassifizierung mit mehreren Bezeichnungen.

Operationalisierung in jeder Größenordnung mit branchenführenden MLOps-Funktionen

Azure Machine Learning bietet integrierte MLOps-Funktionen zur Verwaltung des Lebenszyklus beim maschinellen Lernen auf Enterpriseniveau, mit denen Data Science- und IT-Teams gemeinsam die Modellentwicklung und -bereitstellung beschleunigen können.

„TransLink konnte mithilfe von MLOps in Azure Machine Learning Modelle erstellen und verwalten und sie in der Produktion bereitstellen. Dies sorgte für eine größere Effizienz und Transparenz bei der Übertragung von mehr als 16.000 Machine Learning-Modellen aus der Pilotphase in die Produktion. TransLink-Kunden erhielten letztlich eine Verbesserung der vorhergesagten Busabfahrtzeiten um 74 % gegenüber den tatsächlichen Zeiten, sodass sie ihre Reisen mit dem Busnetz von TransLink besser planen können.“ – Sze-Wan Ng, Director Analytics & Development, Translink.

Neue Updates zum Erstellen von reproduzierbaren Modellen und Erreichen von Governance und Kontrolle beim maschinellen Lernen

Datasets helfen Data Scientists und Technikern im Bereich des maschinellen Lernens dabei, mühelos auf Daten aus verschiedenen Azure-Speicherdiensten zuzugreifen, Datasets schnell anzuwenden und effizient zwischen verschiedenen Aufgaben wiederzuverwenden und die Herkunft von Daten automatisch nachzuverfolgen. Umfangreiche Dataset- und Modellregistrierungen helfen bei der Nachverfolgung von Assets und Informationen für eine effektive Operationalisierung von Modellen und eine Vereinfachung von Workflows vom Training bis zum Rückschluss. Versionskontrolle hilft beim Nachverfolgen und Verwalten von Ressourcen. Neben der verbesserten Nachverfolgung unterstützt dies auch die Erstellung reproduzierbarer Pipelines für konsistente Modellbereitstellung. Überwachungspfadfunktionen stellen die Integrität von Assets sicher und bieten Kontrollprotokolle, die bei der Erfüllung behördlicher Vorgaben helfen.

Neue Updates für die einfache Bereitstellung von Modellen und die effiziente Verwaltung des Lebenszyklus des maschinellen Lernens

Batchrückschlüsse tragen zur Steigerung der Produktivität und Senkung der Kosten bei, indem Vorhersagen über Terabyte von strukturierten und unstrukturierten Daten generiert werden. Kontrollierter Rollout ermöglicht die Bereitstellung verschiedener Modellversionen unter einem gemeinsamen Bewertungsendpunkt für die Implementierung einer ausgereiften Bereitstellungspipeline und die zuversichtliche Freigabe von Modellen. Datendriftüberwachung hilft bei der Aufrechterhaltung der Modellgenauigkeit, indem Probleme mit der Modellleistung durch Änderungen der Modelleingabedaten im Lauf der Zeit erkannt werden. Die Driftanalyse schließt die Größenordnung der Datendrift, die Anteile der einzelnen Features und andere Erkenntnisse ein, sodass entsprechende Maßnahmen ergriffen werden können, einschließlich eines Neutrainings des Modells.

 

MLOps-Funktionen wie Datendriftvisualisierungen bieten auf der Studio-Weboberfläche Metriken wie die Driftgrößenordnung, hier im Lauf der Zeit steigend, und den Beitrag der einzelnen Features zur Drift.

Datendriftüberwachung

Innovation mit offenen und interoperablen Funktionen

Mit Azure Machine Learning können Entwickler und Data Scientists die integrierte Unterstützung von Open-Source-Tools und -Frameworks wie PyTorch, TensorFlow und scikit-learn nutzen und auf das offene und interoperable ONNX-Format zugreifen. Wir unterstützen nun ONNX (Open Neural Network Exchange), den offenen Standard für die Darstellung von maschinellem Lernen. Mit dem neuen Release v1.0 bietet die ONNX-Runtime stabile Python-APIs, die in Azure Machine Learning sowohl mit CPUs als auch mit GPUs verwendet werden können.

Neue R-Funktionen ermöglichen Data Scientists das Ausführen von R-Aufträgen in Azure Machine Learning und das anschließende Verwalten und Bereitstellen von R-Modellen als Webdienste. Data Scientists können ihre Entwicklungsumgebung selbst wählen – der Zugriff auf die in den Browser integrierte Entwicklungsumgebung (IDE) von RStudio Server (Open-Source-Edition) ist mit nur einem Klick oder über Jupyter mit R möglich.

Azure Synapse Analytics ist nun fest in Azure Machine Learning integriert, sodass Sie in großem Umfang weitere Erkenntnisse aus allen Ihren Daten gewinnen und Machine Learning-Modelle in Ihren intelligenten Apps anwenden können.

Azure Open Datasets sind nun allgemein verfügbar und bieten zusammengestellte Datasets, die in Azure gehostet und aus Azure Machine Learning-Arbeitsbereichen einfach zugänglich sind und somit für ein schnelleres Modelltraining sorgen. Es sind nun über 25 Datasets verfügbar, einschließlich sozioökonomischer Daten, Satellitenbildern u. v. m. Neue Datasets kommen stetig hinzu, und Sie können weitere Datasets für Azure nominieren.

Ein sicheres Fundament

„Mit Azure Machine Learning können unsere Data Science-Teams in einer Umgebung arbeiten, die durch Industriestandard-Vertrauensstellungen und -Compliance unterstützt werden. Die für den Einsatz in Unternehmen vorbereiteten Funktionen wie rollenbasierte Zugriffsteuerung im VNET und Schlüsseltresore stellen sicher, dass wir eine fein abgestimmte Kontrolle über unsere Ressourcen haben und Innovation auf einer sicheren Plattform bereitstellen können, die auch die Produktivität verbessert. Die Teams können sich auf Aufgaben des maschinellen Lernens konzentrieren, anstatt sich mit Infrastruktur und Setup zu befassen.“ – Cary Goltermann, Manager, Ignition Tax, KPMG LLP.

Updates für Sicherheit und Unternehmensfähigkeit

Die Kapazitätsverwaltung für den Arbeitsbereich (derzeit in der Vorschauphase) hilft Administratoren dabei, die Computenutzung in allen Arbeitsbereichen und Clustern innerhalb eines Abonnements zu überprüfen und eine effiziente Ressourcenverteilung vorzunehmen. Kapazitätsgrenzen können festgelegt werden, um Ressourcen für Kapazitätsverwaltung und Governance neu zuzuweisen. Rollenbasierte Zugriffssteuerung (Role Based Access Control, RBAC – in der Vorschauphase) trägt dazu bei, benutzerdefinierte Rollen für eine abgestufte Zugriffssteuerung zu definieren und erweiterte Sicherheitsszenarien zu unterstützen. Virtuelle Netzwerke oder VNETs (in der Vorschauphase) bieten eine Sicherheitsabgrenzung für die Isolierung von Computeressourcen, die für das Training und die Bereitstellung von Modellen beim Ausführen von Experimenten über Rückschlüsse verwendet werden.

Unvoreingenommenheit: Zusätzlich zur Modellinterpretierbarkeit in Azure Machine Learning, die Transparenz und Modellverständnis fördert, können Data Scientists und Entwickler nun Fairlearn nutzen, das neue Open-Source-Tool für die Bewertung und Verbesserung der Unvoreingenommenheit. Dieses Tool hilft Organisationen dabei, über eine Gruppe von intuitiven und konfigurierbaren Visualisierungen Erkenntnisse über die Unvoreingenommenheit in ihren Modellvorhersagen zu gewinnen.

 

Die Unvoreingenommenheitsfunktionen helfen dabei, Erkenntnisse zur Unvoreingenommenheit des Modells zu gewinnen, z. B. über die Visualisierung, die Abweichungen in den Vorhersagen für Untergruppen zeigt, in diesem Fall anhand des Geschlechts.

Erkenntnisse durch das Unvoreingenommenheitsfeature

Beginnen Sie noch heute mit dem Entwickeln.

Wir freuen uns, diese Funktionen für Sie bereitzustellen, mit denen Sie den Lebenszyklus beim maschinellen Lernen beschleunigen können: von neuen Produktivitätsoberflächen, durch die das maschinelle Lernen für jeden Kenntnisstand zugänglich wird, bis hin zu stabilen MLOps-Funktionen und Sicherheit auf Enterpriseniveau, die auf einer offenen und vertrauenswürdigen Plattform basieren. Wir werden weiterhin stetig in das maschinelle Lernen investieren, um Ihr Unternehmen und Ihre Anwendungen zu unterstützen und Ihnen dabei zu helfen, Ihre geschäftliche Transformation mit KI voranzubringen.


Azure. Erfinden mit dem Ziel im Blick.