Azure Databricks: neue Funktionen, geringere Kosten

Veröffentlicht am 6 März, 2019

Group Product Manager, Azure Data

Azure Databricks bietet eine schnelle, einfache und für die Zusammenarbeit geeignete Apache Spark™-basierte Analyseplattform, um den Prozess zur Erstellung von Big Data- und KI-Lösungen zu beschleunigen und zu vereinfachen – all dies wird durch branchenführende Vereinbarungen zum Servicelevel (Service Level Agreements, SLAs) unterstützt.

Mit Azure Databricks können Kunden innerhalb von Minuten eine optimierte Apache Spark-Umgebung erstellen. Data Scientists und Data Engineers können in einem interaktiven Arbeitsbereich zusammenarbeiten und dabei die Sprachen und Tools ihrer Wahl verwenden. Durch die native Integration mit Azure Active Directory und anderen Azure-Diensten können Kunden moderne ganzheitliche Lösungen für Data Warehouses, maschinelles Lernen und Echtzeitanalysen entwickeln.

Wir haben Azure Databricks auf viele verschiedene Arten im Einsatz gesehen. Heute freuen wir uns, neue Funktionen ankündigen zu dürfen, die bald veröffentlicht werden.

Allgemeine Verfügbarkeit von Data Engineering Light (Datentechnik (Light))

Kunden können nun mit einer neuen, günstigen Workload namens Data Engineering Light (Datentechnik (Light)) in Azure Databricks einsteigen. Mit dieser Workload können Batchanwendungen auf verwalteten Apache Spark-Instanzen ausgeführt werden. Diese Vorgehensweise ist für einfache, nicht kritische Workloads gedacht, die nicht auf die hohe Leistung, die automatische Skalierung und die anderen Vorteile der Workloads „Data Engineering“ (Datentechnik) und „Data Analytics“ (Datenanalyse) angewiesen sind. Testen Sie die neue Workload.

Wir haben außerdem den Preis für die Workload „Data Engineering“ (Datentechnik) für Standard- und Premium-SKUs reduziert. Diese SKUs sind nun bis zu 25 Prozent günstiger. Die neue Preisgestaltung für Azure Databricks-SKUs finden Sie in der Preisübersicht.

Vorschau des verwalteten MLflow-Frameworks

Bei MLflow handelt es sich um ein Open Source-Framework, das zum Verwalten des Lebenszyklus für Machine Learning eingesetzt wird. Mit dem verwalteten MLflow-Framework können Kunden über die Azure Databricks-Umgebung nativ auf die Plattform zugreifen und sich über Azure Active Directory authentifizieren. Kunden profitieren durch das verwaltete MLflow-Framework in Azure Databricks von folgenden Möglichkeiten:

  • Sie können Experimente nachverfolgen, indem Parameter, Ergebnisse, Code und Daten auf einem vorkonfigurierten MLflow-Nachverfolgungsserver gespeichert werden. Ausführungen können nun von Azure Databricks aus in Experimenten organisiert werden, und die Ergebnisse können von Azure Databricks-Notebooks aus abgefragt werden, um die leistungsstärksten Modelle zu ermitteln.
  • Sie können Code für Machine Learning und Abhängigkeiten lokal in ein reproduzierbares Projektformat packen und remote auf einem Databricks-Cluster ausführen.
  • Sie können Modelle innerhalb kürzester Zeit für die Produktion bereitstellen.

Hier finden Sie weitere Informationen zum verwalteten MLflow-Framework.

Machine Learning in Azure mit Azure Machine Learning und Azure Databricks

Seit der allgemeinen Verfügbarkeit von Azure Machine Learning Service (AML) im Dezember 2018 und der Integration mit Azure Databricks haben wir überwältigend positives Feedback von Kunden erhalten, die diese Kombination einsetzen, um Machine Learning mit Big Data zu beschleunigen. Azure Machine Learning ergänzt Azure Databricks folgendermaßen:

  • Durch erweiterte Funktionen für automatisiertes Machine Learning, sodass Data Scientists aller Kenntnisstufen geeignete Algorithmen und Hyperparameter schneller ermitteln können.
  • Durch DevOps für Machine Learning, um die Verwaltung, Überwachung und das Updaten von Machine Learning-Modellen zu vereinfachen.
  • Durch die Möglichkeit, Modelle über Cloud und Edge bereitzustellen.
  • Durch eine zentrale Registrierung für Experimente, Pipelines für Machine Learning und Modelle, die organisationsweit erstellt werden.

Die Kombination von Azure Databricks und Azure Machine Learning macht Azure zur besten Cloud für Machine Learning. Kunden profitieren von einer optimierten, automatisch skalierenden Umgebung, die auf Apache Spark basiert, einem für die Zusammenarbeit geeigneten Arbeitsbereich, automatisiertem maschinellem Lernen und der durchgängigen Lebenszyklusverwaltung für maschinelles Lernen.

Workflow: Machine Learning in Azure

Starten Sie noch heute!

Testen Sie Azure Databricks, und senden Sie uns Feedback.