Azure vereinfacht Cloudanalysen

Veröffentlicht am 27 Juni, 2018

General Manager, Azure Storage & Azure Stack
Ab dem 7. Februar 2019 ist Azure Data Lake Storage Gen2 allgemein verfügbar. Weitere Informationen finden Sie im Blogbeitrag „Individually great, collectively unmatched: Announcing updates to 3 great Azure Data Services (Einzeln sehr gut, zusammen großartig: Updates für drei wichtige Azure-Datendienste), wie ADLS die Azure-Analyseplattform besser macht.

Die moderne Unternehmenslandschaft wird von Daten gesteuert. Das macht Analysen und KI mehr denn je zur treibenden Kraft beim Umstieg. Unsere Kunden profitieren bereits heute in großem Maß von der Leistung und Flexibilität sowie den niedrigen Kosten von Azure für Analyse- und KI-Workloads. Wir führen heute neue Funktionen in Azure ein, die das Bereitstellen, Erstellen und Verwalten leistungsstarker Analyse- und KI-Lösungen vereinfachen.

Zunächst einmal freuen wir uns sehr, die Vorschauversion von Azure Data Lake Storage Gen2 bekannt zu geben. Dies ist der einzige Data Lake auf Cloudniveau, der speziell für unternehmenskritische Analyse- und KI-Workloads entwickelt wurde. In Azure Data Lake Storage Gen2 kommen die Vorteile bei Skalierbarkeit und Kosten von Objektspeichern und die Zuverlässigkeit und Leistung des Hadoop-Dateisystems zusammen.

Außerdem geben wir auch mit Freude die allgemeine Verfügbarkeit neuer Funktionen in Azure Data Factory bekannt. Das Integrieren von Daten aus mehreren Quellen zum Validieren, Anreichern und Transformieren von Daten für Einblicke wird damit erheblich vereinfacht.

Diese Weiterentwicklung des Microsoft-Analyseportfolios vereinfacht die Integration getrennter Datenquellen für Kunden. Außerdem können sie damit große Datenmengen auf ökonomische Weise speichern und verarbeiten, um die eigene digitale Transformation voranzutreiben.

Die nächste Stufe von Azure Data Lake Storage

Analyselösungen wie Hadoop wurde ausgehend davon entwickelt, dass sie auf Dateisystemen mit horizontaler Hochskalierung ausgeführt werden. Andere Cloudanbieter setzen solche Lösungen um, indem sie eine Kombination aus einer clientseitigen Dateisystememulation und Objektspeichern mit eingeschränkter Funktionalität nutzen. Dies führt jedoch zu einer verminderten Leistung und Zuverlässigkeit und stellt somit lediglich einen Kompromiss dar.

Azure Data Lake Storage Gen2 bietet einen Data Lake ohne Kompromisse. Es vereint die Kernfunktionen der ersten Generation von Azure Data Lake mit einem Hadoop-kompatiblen Dateisystemendpunkt, der jetzt direkt in Azure Blob Storage integriert ist. Diese Erweiterung verbindet die Vorteile eines Objektspeichers hinsichtlich Skalierbarkeit und Kosten mit der Zuverlässigkeit und Leistung, die normalerweise nur lokale Dateisysteme bieten. Dieses neue Dateisystem umfasst einen vollständig hierarchischen Namespace mit Priorität auf Dateien und Ordnern, sodass Analyseaufträge insgesamt erheblich schneller und zuverlässiger ausgeführt werden können.

Azure Data Lake Storage Gen2 bietet darüber hinaus unbegrenzten Speicher und stellt damit auch für die größten und komplexesten Workloads ausreichend Kapazitäten bereit. Darüber hinaus erhalten Sie mit Azure Data Lake Storage Gen2 eine native Integration mit Azure Active Directory sowie Unterstützung für POSIX-konforme ACLs, mit denen Sie sehr präzise Berechtigungen für Dateien und Ordner festlegen können.

Da Azure Data Lake Storage Gen2 vollständig mit Blob Storage integriert ist, können die Kunden über die neuen am Dateisystem ausgerichteten APIs oder die Objektspeicher-APIs von Blob Storage auf ihre Daten zugreifen. Daneben kommen die Kunden auch in den Genuss der Vorteile von Azure Blob Storage wie der Verschlüsselung ruhender Daten, Objektebenentiering und Lebenszyklusrichtlinien sowie Funktionen für Hochverfügbarkeit und Notfallwiederherstellung wie ZRS und GRS. Alle diese Funktionen stehen zu günstigeren Kosten und mit geringeren Gesamtkosten für die Analyseprojekte der Kunden zur Verfügung! Azure Data Lake Storage Gen2 ist die umfangreichste Data Lake-Lösung, die auf dem Markt verfügbar ist. In der allgemein verfügbaren Version ist Azure Data Lake Storage Gen2 in allen Azure-Regionen verfügbar.

Für eine nahtlose Integration mit führenden Open-Source-Anbietern von Hadoop- und Spark-Analysemodulen arbeiten wir eng mit unseren Partnern zusammen, um Azure Data Lake Storage Gen2 zur perfekt optimierten Data Lake-Lösung für unsere Kunden zu machen.

„Als wichtiger Partner hat Cloudera seit unserer Integration von CDH mit der ersten Generation von Azure Data Lake sehr eng mit Microsoft zusammengearbeitet. Wir sind uns sicher, dass Azure Data Lake Storage Gen2 für unsere Kunden eine herausragende Erfahrung darstellen wird – insbesondere mit Blick auf die Leistung und Stabilität. Wir sind stolz, auch weiterhin umfassenden Plattformsupport für Azure Data Lake Storage Gen2 bereitzustellen.“

- Vikram Makhija, General Manager for Cloud, Cloudera

Datenintegration ganz einfach – mit Azure Data Factory

Durch das rasche Anwachsen von Big Data können es sich Organisationen nicht mehr leisten, durch eine komplexe Integration ihrer Daten an wichtigen analytischen Erkenntnisse aus ihren Geschäften gehindert zu werden. Die nun allgemein verfügbaren neuen Funktionen in Azure Data Factory – dem cloudbasierten Azure-Dienst zur Datenerfassung und -integration – machen es noch einfacher, Rohdaten in nützliche Erkenntnisse umzuwandeln.

Die grafische Benutzeroberfläche mit Drag & Drop-Funktionalität erlaubt Datenspezialisten und Entwicklern das schnelle und einfache Erstellen, Planen und Verwalten der Datenintegration auch bei großen Datenmengen. Azure Data Factory unterstützt jetzt auch Datenerfassungen ohne Code von über 70 Connectors für Datenquellen. Dies beschleunigt die Datenverschiebung zwischen lokalen Standorten, der Cloud und Anwendungen. Wir haben darüber hinaus eine Vorschauversion eines nativen Azure Data Factory-Connectors für Azure Data Lake Storage Gen2 erstellt, mit dem Kunden die Vorteile von Azure Data Lake Storage Gen2 nutzen und Daten ganz einfach aus anderen Datenquellen (einschließlich der ersten Generation von Azure Data Lake) migrieren können.

Außerdem können Datenspezialisten und Entwickler SSIS-Pakete (SQL Server Integration Services) nach Azure verschieben und Azure Data Factory die Verwaltung ihrer Ressourcen überlassen, sodass trotz geringerer Betriebskosten eine höhere Skalierbarkeit und Verfügbarkeit erreicht wird. Das in London ansässige Datenanalyseunternehmen Concentra Analytics konnte die eigene Entwicklungszeit für automatisierte Data Warehouses um 80 % verringern, indem es die eigenen SSIS-Pakete nach Azure verschoben hat.

„Wir haben keinerlei Probleme mit Kunden, deren Daten lokal und in Clouds verteilt sind, selbst wenn es sich um große Datensätze handelt. Mit Azure Data Factory können unsere Kunden die von DataPlus automatisch generierten und in Azure veröffentlichten SSIS-Pakete nutzen, um Skalierbarkeit zu erreichen.“

- Weelin Lim, Director of Business Intelligence, Concentra Analytics

Optimale Analysen mit Azure

Wir möchten Azure zur idealen Plattform für Organisationen machen, auf der diese aus ihren Daten Informationen gewinnen und Innovationen vorantreiben können. Kunden profitieren von der engen Integration mit anderen Azure-Diensten. Dies umfasst die einfachere und weniger aufwendige Erstellung von umfassenden, leistungsstarken Analyselösungen auf Cloudebene ebenso wie die Unterstützung moderner Data Warehouse-Lösungen, komplexer Analysen und Analysen in Echtzeit.

Big Data und erweiterte Analyse

Erfahren Sie mehr über Azure Data Lake Storage:

Erfahren Sie mehr über Azure Data Factory: