Trace Id is missing
Zum Hauptinhalt wechseln

Azure Databricks

KI mit Apache Spark™-basierten Analysen entwickeln.

Big Data-Analysen und KI mit optimierter Apache Spark-Umgebung

Gewinnen Sie Erkenntnisse aus Ihren Daten, erstellen Sie KI-Lösungen mit Azure Databricks, richten Sie Ihre Apache Spark™-Umgebung in wenigen Minuten ein, skalieren Sie automatisch, und arbeiten Sie in einem interaktiven Arbeitsbereich gemeinsam mit anderen an Projekten. Azure Databricks unterstützt Python, Scala, R, Java und SQL sowie Data Science-Frameworks und -Bibliotheken, z. B. TensorFlow, PyTorch und scikit-learn.

Apache Spark™ ist ein eingetragenes Markenzeichen der Apache Software Foundation.

Erfassung und Orchestrierung mit Azure Data Factory. Vorbereitung, Umwandlung und Anreicherung mit Azure Databricks. Bereitstellung mit Azure Synapse Analytics. Speicherung mit Azure Data Lake Storage. Visualisierung mit Power BI.

Zuverlässige Datentechnik

Umfangreiche Datenverarbeitung für Batch- und Streamingworkloads.

Analyse für alle Daten

Vollständige und aktuelle Daten durch Analysen.

Kollaborative Data Science

Einfachere und schnellere Data Science für große Datasets.

Open-Source-basiert

Schnelle, optimierte Apache Spark-Umgebung.

Schneller Einstieg mit einer optimierten Apache Spark-Umgebung

Azure Databricks umfasst die aktuellste Version von Apache Spark, sodass Sie nahtlose Integrationen mit Open-Source-Bibliotheken durchführen können. Erstellen Sie Cluster per Spinup, und führen Sie schnelle Erstellungen in einer vollständig verwalteten Apache Spark-Umgebung mit dem globalen Umfang und der weltweiten Verfügbarkeit von Azure durch. Cluster werden eingerichtet, konfiguriert und anschließend optimiert, um eine hohe Zuverlässigkeit und Leistung zu gewährleisten, ohne dass Überwachung erforderlich ist. Nutzen sie die automatische Skalierung und das automatische Beenden, um die Gesamtkosten zu senken.

Bildschirm „Erstellen eines neuen Clusters“ in Azure Databricks.
Einführung in Apache Spark in Azure Databricks

Erhöhte Produktivität mit einem gemeinsamen Arbeitsbereich und beliebten Sprachen

Arbeiten Sie auf einer offenen, einheitlichen Plattform effektiv zusammen. Sie können sämtliche Analyseworkloads ausführen – ganz gleich, ob Sie wissenschaftliche Fachkraft für Daten, technische Fachkraft für Daten oder Business Analyst sind. Verwenden Sie Ihre bevorzugte Sprache – egal ob Python, Scala, R oder SQL. Einfache Versionskontrolle von Notebooks mit GitHub und Azure DevOps.

Leistungsstarke Machine-Learning-Funktionen für Big Data

Nutzen Sie komplexe automatisierte Machine Learning-Funktionen dank des integrierten Diensts Azure Machine Learning, um schnell geeignete Algorithmen und Hyperparameter zu bestimmen. Vereinfachen Sie die Verwaltung, Überwachung und das Aktualisieren von Machine Learning-Modellen, die von der Cloud bis zum Edge bereitgestellt werden. Azure Machine Learning bietet zudem eine zentrale Registrierung für Ihre Experimente, Machine-Learning-Pipelines und -Modelle.

Ein Arbeitsbereich mit dem Titel „ML-Modell mit Scikit-Learn“ in Azure Databricks
Eine Prognose des Skalierungsbedarfs in Azure Databricks.

Leistungsstarkes, modernes Data Warehousing

Kombinieren Sie Daten jeden Umfangs, und gewinnen Sie Erkenntnisse mithilfe von Analysedashboards und Betriebsberichten. Automatisieren Sie die Datenverschiebung mit Azure Data Factory, laden Sie die Daten anschließend in Azure Data Lake Storage, transformieren und bereinigen Sie diese mit Azure Databricks, und stellen Sie sie für die Analyse mit Azure Synapse Analytics bereit. Modernisieren Sie Ihr Data Warehouse in der Cloud für unübertroffene Leistung und Skalierbarkeit.

Wichtige Dienstfunktionen

  • a

    Optimierte Spark-Engine

    Nutzen Sie die einfache Datenverarbeitung in einer automatisch skalierenden Infrastruktur, und profitieren Sie dabei dank der hochoptimierten Apache Spark™-Engine von einer bis zu 50-fachen Leistungssteigerung.

  • a

    Machine-Learning-Runtime

    Mit einem Klick können Sie auf vorkonfigurierte Machine-Learning-Umgebungen zugreifen, um Ihre Machine-Learning-Prozesse mit modernen und gängigen Frameworks wie PyTorch, TensorFlow und scikit-learn zu erweitern.

  • a

    MLflow

    Überwachen Sie Experimente, geben Sie diese frei, reproduzieren Sie Testläufe, und verwalten Sie Modelle gemeinsam in einem zentralen Repository.

  • c

    Auswahl von Sprachen

    Verwenden Sie Ihre bevorzugte Sprache, z. B. Python, Scala, R, Spark SQL und .NET, für serverlose oder bereitgestellte Computeressourcen.

  • c

    Kollaborative Notebooks

    Greifen Sie schnell auf Daten zu, und analysieren Sie diese, um Informationen zu gewinnen und weiterzugeben. Darüber hinaus können Sie Modelle gemeinsam mit den Tools und Sprachen Ihrer Wahl entwickeln.

  • c

    Delta Lake

    Gestalten Sie vorhandene Data Lakes zuverlässiger und skalierbarer, indem Sie eine Open-Source-Speicherschicht für Transaktionen nutzen, die für den gesamten Datenlebenszyklus konzipiert ist.

  • v

    Native Integration mit Azure-Diensten

    Ergänzen Sie Ihre Analyse- und Machine-Learning-Lösung durch die enge Verzahnung mit Azure-Diensten wie Azure Data Factory, Azure Data Lake Storage, Azure Machine Learning und Power BI.

  • spar

    Interaktive Arbeitsbereiche

    Ermöglichen Sie die nahtlose Zusammenarbeit zwischen wissenschaftlichen Fachkräften für Daten, technischen Fachkräften für Daten und Business Analysts.

  • d

    Sicherheit der Businessklasse

    Mit den benutzerfreundlichen, nativen Sicherheitsfeatures werden Ihre Daten am Speicherort geschützt, sodass die Arbeitsbereiche für Analysen für Tausende Benutzer und Datasets stets konform, privat und isoliert sind.

  • s

    Bereit für die Produktion

    Führen Sie unternehmenskritische Datenworkloads skalierbar auf einer vertrauenswürdigen Datenplattform aus, die Integrationen für CI/CD und Überwachungslösungen bietet.

Lernen Sie aus Beispielen für Lösungsarchitekturen

Data Science und Machine Learning mit Azure Databricks

Gewinnen Sie mühelos Erkenntnisse aus Livestreamingdaten. Erfassen Sie kontinuierlich Daten von jedem IoT-Gerät oder Protokolle von Websiteclickstreams, und verarbeiten Sie diese nahezu in Echtzeit.

Moderne Analysearchitektur mit Azure Databricks

Verwandeln Sie Ihre Daten mit erstklassigen Tools für maschinelles Lernen in verwertbare Informationen. Diese Architektur ermöglicht es Ihnen, beliebige Daten in beliebiger Größe zu kombinieren und maßgeschneiderte Machine Learning-Modelle zu erstellen und bereitzustellen.

Pipelines für Erfassung, ETL und Streamverarbeitung mit Azure Databricks

Beschleunigen und verwalten Sie den gesamten Machine-Learning-Lebenszyklus mit Azure Databricks, MLflow und Azure Machine Learning, um Machine-Learning-Anwendungen zu entwickeln, zu teilen, bereitzustellen und zu verwalten.

Integrierte umfassende Sicherheit und Compliance

Weitere Informationen zu Azure Databricks-Produkten und -Diensten

Azure Data Factory

Hybrid-Datenintegrationsdienst für einfachere ETL-Vorgänge im großen Stil.

Azure Data Lake Storage Gen2

Hochgradig skalierbare, sichere Data Lake-Funktionalität auf Basis von Azure Blob Storage.

Azure Machine Learning

Machine-Learning-Dienst für Unternehmen zur schnelleren Erstellung und Bereitstellung von Modellen.

Power BI

Fügen Sie Ihren Anwendungen Analysen und interaktive Berichte hinzu.

Erste Schritte mit einem kostenlosen Azure-Konto

1

Kostenlos starten. Sie erhalten ein Guthaben von 200 USD, das Sie innerhalb von 30 Tagen verwenden können. Solange Sie über Ihr Guthaben verfügen, können Sie viele unserer beliebtesten Dienste kostenlos nutzen. Außerdem erhalten Sie mehr als 55 weitere Dienste stets kostenlos.

2

Nachdem Ihr Guthaben aufgebraucht ist, wechseln Sie zur nutzungsbasierten Zahlung, um Ihr Wachstum mit den gleichen kostenlosen Dienstleistungen voranzutreiben. Es fallen nur Gebühren an, wenn Sie die kostenlosen monatlichen Kontingente überschreiten.

3

Nach 12 Monaten erhalten Sie die über 55 Dienste weiterhin kostenlos und zahlen nur für die Nutzung über die monatlichen Freimengen hinaus.

Community und Azure-Support

Im MSDN-Forum und auf Stack Overflowkönnen Sie Fragen stellen und Unterstützung und Antworten von Microsoft-Techniker*innen und Azure-Expert*innen aus der Community erhalten. Alternativ können Sie sich an den Azure-Supportwenden.

Beliebte Labs und Vorlagen

Führen Sie eigenverantwortliche Labs durch, und lernen Sie beliebte Schnellstartvorlagen für häufige Konfigurationen  kennen, die von Microsoft und der Community erstellt wurden.

Häufig gestellte Fragen zu Azure Databricks

  • Die Azure Databricks-SLA sichert eine Verfügbarkeit von 99,95 % zu.

  • Eine Databricks-Einheit (Databricks Unit, DBU) ist eine Verarbeitungskapazitätseinheit pro Stunde, deren Nutzung pro Sekunde abgerechnet wird.

  • Ein Datentechnikworkload ist ein Auftrag, der den Cluster, in dem er ausgeführt wird, sowohl automatisch startet als auch beendet. Ein Workload kann z. B. durch den Azure Databricks-Auftragsplaner ausgelöst werden, der einen Apache Spark-Cluster exklusiv für den Auftrag startet und diesen beendet, sobald der Auftrag abgeschlossen ist.

    Der Datenanalyseworkload ist nicht automatisiert. Befehle in Azure Databricks-Notebooks werden z. B. in Apache Spark-Clustern ausgeführt, bis sie manuell beendet werden. Mehrere Benutzer können einen Cluster gemeinsam verwenden, um ihn zu analysieren.

Sind Sie bereit für ein kostenloses Azure-Konto? Los geht's!