Azure SQL Data Warehouse ist jetzt Azure Synapse Analytics

Veröffentlicht am 7 November, 2019

Director of Product, Azure Data

Am 4. November haben wir Azure Synapse Analytics bekannt gegeben, die nächste Evolutionsstufe von Azure SQL Data Warehouse. Azure Synapse ist ein grenzenloser Analysedienst, der Data Warehousing für Unternehmen mit Big Data-Analysen kombiniert. Er ermöglicht flexible Datenabfragen nach Ihren Vorstellungen, indem serverlose On-Demand-Ressourcen oder bereitgestellte Ressourcen im gewünschten Umfang verwendet werden. Azure Synapse Analytics vereint diese beiden Bereiche mit einer einheitlichen Oberfläche zum Erfassen, Vorbereiten, Verwalten und Bereitstellen von Daten, um Business-Intelligence- und Machine-Learning-Anforderungen umgehend zu erfüllen.

Mit Azure Synapse Analytics können Datenexperten unter Verwendung der bekannten SQL-Sprache sowohl relationale als auch nicht relationale Daten abfragen. Dies kann durch serverlose On-Demand-Abfragen zur Datenuntersuchung und Ad-hoc-Analysen oder durch bereitgestellte Ressourcen für Ihre anspruchsvollsten Data Warehousing-Anforderungen erfolgen. Sie benötigen nur einen einzigen Dienst für jede beliebige Workload.

Tatsächlich ist es das erste und einzige Analysesystem, das alle TPC-H-Abfragen im Petabytebereich ausgeführt hat. Mit Azure Synapse können Kunden, die bisher SQL Data Warehouse nutzen, bestehende Data Warehouse-Workloads aus der Produktion auch weiterhin ausführen und automatisch von den neuen Features der Vorschauversion profitieren, sobald diese allgemein verfügbar sind. Sie können sich für die Vorschau neuer Features registrieren und dann Funktionen wie serverlose On-Demand-Abfragen, Azure Synapse Studio und die Apache Spark™-Integration nutzen.

  Diagramm: so verbindet Azure Synapse Analytics Power BI, Azure Machine Learning und Ihr Ökosystem

SQL für mehr als nur Data Warehousing

Eine cloudnative, verteilte SQL-Verarbeitungs-Engine bildet das Fundament von Azure Synapse und ermöglicht dem Dienst die Ausführung der anspruchsvollsten Enterpriseworkloads für Data Warehousing. Wir haben in dieser Woche auf der Ignite eine Reihe toller Features vorgestellt, die Data Warehousing mit Azure Synapse einfacher machen und Organisationen die Verwendung von SQL für viele neue Analysefälle ermöglichen sollen.

Schnellere Erkenntnisse aus allen Daten

Azure Synapse ist vollständig mit Power BI und Azure Machine Learning integriert, um allen Benutzern, vom Data Scientist mit Statistikcode bis zum Geschäftsbenutzer mit Power BI, bessere Erkenntnisse zu liefern. Damit auch alle Analysetypen möglich werden, haben wir außerdem eine native und integrierte Unterstützung für Vorhersagen sowie Verbesserungen zur Laufzeit an der Verarbeitung von Streamingdaten, Parquet-Dateien und PolyBase durch Azure Synapse bekannt gegeben. Sehen wir uns das im Folgenden genauer an:

  • Mit der nativen PREDICT-Anweisung können Sie Machine Learning-Modelle in Ihrem Data Warehouse bewerten, sodass keine umfangreichen und komplexen Datenverschiebungen mehr nötig sind. Die PREDICT-Funktion (als Vorschauversion verfügbar) basiert auf einem offenen Modellframework und erstellt Vorhersagen anhand der Benutzerdaten als Eingabe. Benutzer können vorhandene Modelle, die in Azure Machine Learning, Apache Spark™ oder anderen Frameworks trainiert wurden, in eine Darstellung in einem internen Format konvertieren. Dadurch müssen sie nicht bei null anfangen und gelangen schneller zu Erkenntnissen.

Diagramm zum Erstellen und Hochladen von Modellen zur Bewertung mit SQL Analytics im Data Warehouse

  • Wir haben die Unterstützung für die Direkterfassung von Streams aktiviert und damit die Möglichkeit geschaffen, Analyseabfragen über Streamingdaten auszuführen. Funktionen wie Joins über mehrere Streamingeingaben, Aggregationen innerhalb einer oder mehrerer Streamingeingaben, Transformation teilstrukturierter Daten und mehrere temporale Fenster werden jetzt (als Vorschauversion) direkt in Ihrer Data Warehousing-Umgebung unterstützt. Zur Erfassung von Streams können Kunden eine Integration mit Event Hubs (einschließlich Event Hubs für Kafka) und IoT Hubs nutzen.

  • Außerdem entfernen wir eines der Hindernisse beim sicheren und einfachen Datenaustausch innerhalb und außerhalb Ihrer Organisation mit der Azure Data Share-Integration für den Austausch von Data Lake- und Data Warehouse-Daten.

  • Mithilfe der neuen ParquetDirect-Technologie ermöglichen wir interaktive Abfragen über den Data Lake (als Vorschauversion). Damit soll der Zugriff auf Parquet-Dateien über eine native Unterstützung direkt in der Engine möglich gemacht werden. Durch verbesserte Datenscanraten, intelligente Datenzwischenspeicherung und Columnstore-Batchverarbeitung konnten wir die PolyBase-Ausführung um den Faktor 13 verbessern.

Diagramm der Leistungssteigerung mit ParquetDirect

Workloadisolation

Für die Unterstützung unserer Kunden bei der Demokratisierung ihrer Data Warehouses geben wir neue Features für eine intelligente Workloadverwaltung bekannt. Die neue Workloadisolation ermöglicht Ihnen die Verwaltung der Ausführung heterogener Workloads bei mehr Flexibilität und Kontrolle über Data Warehouse-Ressourcen. Dies steigert die Vorhersagbarkeit von Ausführungen und gewährleistet die Einhaltung vordefinierter SLAs.

Abbildung der Workloadisolation in Data Warehouse

COPY-Anweisung

Die Analyse von Daten im Petabytebereich erfordert auch die Erfassung von Daten im Petabytebereich. Zur Optimierung der Datenerfassung führen wir die ebenso einfache wie flexible COPY-Anweisung hinzu. Mit nur einem Befehl kann Azure Synapse nun Daten nahtlos, schnell und sicher in ein Data Warehouse einfügen.

Mithilfe dieser neuen COPY-Anweisung genügt eine einzige T-SQL-Anweisung, um Daten zu laden, Standard-CSV-Dateien zu analysieren und mehr.

Beispielcode für die COPY-Anweisung:

COPY INTO dbo.[FactOnlineSales] FROM ’https://contoso.blob.core.windows.net/Sales/’

Schutz der Daten mit einzigartiger Sicherheit

Azure verfügt über die fortschrittlichsten auf dem Markt verfügbaren Sicherheits- und Datenschutzfeatures. Features wie die automatisierte Bedrohungserkennung und immer aktivierte Datenverschlüsselung sind im Azure Synapse Analytics-Fabric integriert. Für eine präzise Zugriffssteuerung können Unternehmen mithilfe der Sicherheit auf Spaltenebene und der nativen Sicherheit auf Zeilenebene dazu beitragen, dass Daten sicher und privat bleiben. Außerdem können vertrauliche Daten mit der dynamischen Datenmaskierung automatisch in Echtzeit geschützt werden.

Um Sicherheit und Datenschutz noch weiter zu steigern, führen wir Azure Private Link ein. Dieser Dienst bietet eine sichere und skalierbare Möglichkeit, bereitgestellte Ressourcen aus Ihrem eigenen virtuellen Azure-Netzwerk (VNET) zu nutzen. Das Herstellen einer sicheren Verbindung erfolgt über einen zustimmungsbasierten Aufrufflow. Nach der Herstellung werden allen Daten, die zwischen Azure Synapse und den Dienstconsumern ausgetauscht werden, vom Internet isoliert und verbleiben ausschließlich im Microsoft-Netzwerk. Es sind keine Gateways, NAT-Geräte (Netzwerkadressenübersetzung) oder öffentlichen IP-Adressen erforderlich, um mit dem Dienst zu kommunizieren.

Abbildung von Azure Private Link zur sicheren und skalierbaren Nutzung bereitgestellter Ressourcen in einem eigenen virtuellen Azure-Netzwerk (VNET)

Jetzt einsteigen

Mit den allgemein verfügbaren Features in Azure Synapse Analytics können Unternehmen ihre heute in der Produktion befindlichen vorhandenen Data-Warehouse-Workloads auch weiterhin ausführen.


Azure. Erfinden mit dem Ziel im Blick.