Azure Databricks

Ein schneller, einfacher und kollaborativer Analysedienst auf Basis von Apache SparkTM

Big Data-Analysen und KI mit optimierter Apache Spark-Umgebung

Gewinnen Sie Erkenntnisse aus Ihren Daten, erstellen Sie KI-Lösungen mit Azure Databricks, richten Sie Ihre Apache Spark™-Umgebung in wenigen Minuten ein, skalieren Sie automatisch, und arbeiten Sie in einem interaktiven Arbeitsbereich gemeinsam mit anderen an Projekten. Azure Databricks unterstützt Python, Scala, R, Java und SQL sowie Data Science-Frameworks und -Bibliotheken, z. B. TensorFlow, PyTorch und scikit-learn.

Apache Spark™ ist ein eingetragenes Markenzeichen der Apache Software Foundation.

Zuverlässige Datentechnik

Umfangreiche Datenverarbeitung für Batch- und Streamingworkloads

Analyse für alle Daten

Vollständige und aktuelle Daten durch Analysen

Kollaborative Data Science

Einfachere und schnellere Data Science für große Datasets

Open-Source-basiert

Schnelle, optimierte Apache Spark-Umgebung

Schneller Einstieg mit einer optimierten Apache Spark-Umgebung

Azure Databricks umfasst die aktuellste Version von Apache Spark, sodass Sie nahtlose Integrationen mit Open-Source-Bibliotheken durchführen können. Erstellen Sie Cluster per Spinup, und führen Sie schnelle Erstellungen in einer vollständig verwalteten Apache Spark-Umgebung mit dem globalen Umfang und der weltweiten Verfügbarkeit von Azure durch. Cluster werden eingerichtet, konfiguriert und anschließend optimiert, um eine hohe Zuverlässigkeit und Leistung zu gewährleisten, ohne dass Überwachung erforderlich ist. Nutzen sie die automatische Skalierung und das automatische Beenden, um die Gesamtkosten zu senken.

Azure Databricks-Dokumentation

Erhöhte Produktivität mit einem gemeinsamen Arbeitsbereich und beliebten Sprachen

Arbeiten Sie mit den interaktiven Arbeitsbereichs- und Notebookfunktionen effektiv mit anderen an gemeinsamen Projekten – egal ob Sie ein Data Engineer, ein Data Scientist oder ein Business Analyst sind. Verwenden Sie Ihre bevorzugte Sprache – egal ob Python, Scala, R oder SQL. Einfache Versionskontrolle von Notebooks mit GitHub und Azure DevOps.

So erstellen Sie einen Azure Databricks-Arbeitsbereich

Leistungsstarke Machine-Learning-Funktionen für Big Data

Nutzen Sie komplexe automatisierte Machine Learning-Funktionen dank des integrierten Diensts Azure Machine Learning, um schnell geeignete Algorithmen und Hyperparameter zu bestimmen. Vereinfachen Sie die Verwaltung, Überwachung und das Aktualisieren von Machine Learning-Modellen, die von der Cloud bis zum Edge bereitgestellt werden. Azure Machine Learning bietet zudem eine zentrale Registrierung für Ihre Experimente, Machine-Learning-Pipelines und -Modelle.

Webinar zu Azure Databricks und Azure Machine Learning ansehen

Leistungsstarkes, modernes Data Warehousing

Kombinieren Sie Daten jeden Umfangs, und gewinnen Sie Erkenntnisse mithilfe von Analysedashboards und Betriebsberichten. Automatisieren Sie die Datenverschiebung mit Azure Data Factory, laden Sie die Daten anschließend in Azure Data Lake Storage, transformieren und bereinigen Sie diese mit Azure Databricks, und stellen Sie sie für die Analyse mit Azure Synapse Analytics bereit. Modernisieren Sie Ihr Data Warehouse in der Cloud für unübertroffene Leistung und Skalierbarkeit.

Mehr zu Cloudanalysen in Azure

Wichtige Dienstfunktionen

Optimierte Spark-Engine

Nutzen Sie die einfache Datenverarbeitung in einer automatisch skalierenden Infrastruktur, und profitieren Sie dabei dank der hochoptimierten Apache Spark™-Engine von einer bis zu 50-fachen Leistungssteigerung.

Machine-Learning-Runtime

Mit einem Klick können Sie auf vorkonfigurierte Machine-Learning-Umgebungen zugreifen, um Ihre Machine-Learning-Prozesse mit modernen und gängigen Frameworks wie PyTorch, TensorFlow und scikit-learn zu erweitern.

MLflow

Überwachen Sie Experimente, geben Sie diese frei, reproduzieren Sie Testläufe, und verwalten Sie Modelle gemeinsam in einem zentralen Repository.

Auswahl von Sprachen

Verwenden Sie Ihre bevorzugte Sprache, einschließlich Python, Scala, R, Spark SQL und .NET, für serverlose oder bereitgestellte Computeressourcen.

Kollaborative Notebooks

Greifen Sie schnell auf Daten zu, und analysieren Sie diese, um Informationen zu gewinnen und weiterzugeben. Darüber hinaus können Sie Modelle gemeinsam mit den Tools und Sprachen Ihrer Wahl entwickeln.

Delta Lake

Gestalten Sie vorhandene Data Lakes zuverlässiger und skalierbarer, indem Sie eine Open-Source-Speicherschicht für Transaktionen nutzen, die für den gesamten Datenlebenszyklus konzipiert ist.

Native Integration mit Azure-Diensten

Ergänzen Sie Ihre Analyse- und Machine-Learning-Lösung durch die enge Verzahnung mit Azure-Diensten wie Azure Data Factory, Azure Data Lake Storage, Azure Machine Learning und Power BI.

Interaktive Arbeitsbereiche

Ermöglichen Sie die nahtlose Zusammenarbeit zwischen Data Scientists, Data Engineers und Business Analysts.

Sicherheit auf Unternehmensniveau

Mit den benutzerfreundlichen, nativen Sicherheitsfeatures werden Ihre Daten am Speicherort geschützt, sodass die Arbeitsbereiche für Analysen für Tausende Benutzer und Datasets stets konform, privat und isoliert sind.

Bereit für die Produktion

Führen Sie unternehmenskritische Datenworkloads skalierbar auf einer vertrauenswürdigen Datenplattform aus, die Integrationen für CI/CD und Überwachungslösungen bietet.

Lernen Sie aus Beispielen für Lösungsarchitekturen

Echtzeitanalysen in Big-Data-Architekturen

Gewinnen Sie mühelos Erkenntnisse aus Livestreamingdaten. Erfassen Sie kontinuierlich Daten von jedem IoT-Gerät oder Protokolle von Websiteclickstreams, und verarbeiten Sie diese nahezu in Echtzeit.

Erweiterte Analysearchitektur

Verwandeln Sie Ihre Daten mit erstklassigen Tools für maschinelles Lernen in wertvolle Erkenntnisse. Diese Architektur ermöglicht es Ihnen, beliebige Daten in beliebiger Größe zu kombinieren und maßgeschneiderte Machine Learning-Modelle zu erstellen und bereitzustellen.

Verwaltung des Machine-Learning-Lebenszyklus

Beschleunigen und verwalten Sie den gesamten Machine-Learning-Lebenszyklus mit Azure Databricks, MLflow und Azure Machine Learning, um Machine-Learning-Anwendungen zu entwickeln, zu teilen, bereitzustellen und zu verwalten.

Datensicherheit und Datenschutz sind nicht verhandelbar.

  • Schützen, überwachen und verwalten Sie Ihre Daten- und Analyselösung mit einem breiten Angebot an branchenführenden Sicherheits- und Compliancefeatures.

  • Nutzen Sie das einmalige Anmelden und die Integration mit Azure Active Directory, damit sich Datenexperten stärker auf die Gewinnung neuer Erkenntnisse konzentrieren können.

  • Azure verfügt über mehr Zertifizierungen als jeder andere Cloudanbieter. Sehen Sie sich die vollständige Liste an.

Weitere Informationen zu Azure Databricks-Produkten und -Diensten

Azure Databricks-Preise

Branchenübergreifend etabliert und von Unternehmen verwendet

Erkennen von Sicherheitsrisiken mit cloudbasiertem Deep Learning

Shell setzt Azure, KI und maschinelles Sehen ein, um Kunden und Angestellte zu schützen.

Erfolgsstory lesen

Shell

Höhere Leistung und mehr Kostenersparnis

Der Datendienst renewablesAI trägt mit Azure und Apache Spark zum Entstehen eines stabilen und gewinnbringenden Markts für Solarenergie bei.

Erfolgsstory lesen

Renewables AI

Vollständige Analyselösung in Azure

Das Logistikunternehmen Linx Cargo Care Group fördert Innovationen im gesamten Unternehmen mit Azure Databricks.

Erfolgsstory lesen

LINX Cargo Care Group

Erste Schritte mit Azure Databricks

Registrieren Sie sich für ein kostenloses Azure-Konto, und erhalten Sie umgehend Zugriff.

In der Dokumentation erfahren Sie mehr zur Verwendung von Azure Databricks.

Sehen Sie sich den Schnellstart an, um einen Cluster, ein Notebook und eine Tabelle zu erstellen.

Community und Azure-Support

Im MSDN-Forum und auf Stack Overflow können Sie Fragen stellen und Unterstützung und Antworten von Microsoft-Technikern und Azure-Experten aus der Community erhalten. Alternativ können Sie sich an den Azure-Support wenden.

Beliebte Labs und Vorlagen

Führen Sie eigenverantwortliche Labs durch, und lernen Sie beliebte Schnellstartvorlagen für häufige Konfigurationen kennen, die von Microsoft und der Community erstellt wurden.

Neuigkeiten und Ressourcen zu Azure Databricks

Häufig gestellte Fragen zu Azure Databricks

  • Die Azure Databricks-SLA garantiert eine Verfügbarkeit von 99,95 %.
  • Eine Databricks-Einheit (Databricks Unit, DBU) ist eine Verarbeitungskapazitätseinheit pro Stunde, deren Nutzung pro Sekunde abgerechnet wird.
  • Eine Datentechnikworkload ist ein Auftrag, der den Cluster, in dem er ausgeführt wird, sowohl automatisch startet als auch beendet. Eine Workload kann z. B. durch den Azure Databricks-Auftragsplaner ausgelöst werden, der einen Apache Spark-Cluster exklusiv für den Auftrag startet und diesen beendet, sobald der Auftrag abgeschlossen ist.
    Die Datenanalyseworkload ist nicht automatisiert. Befehle in Azure Databricks-Notebooks werden z. B. in Apache Spark-Clustern ausgeführt, bis sie manuell beendet werden. Mehrere Benutzer können einen Cluster gemeinsam verwenden, um ihn zu analysieren.

Sind Sie bereit? Dann richten Sie Ihr kostenloses Azure-Konto ein.