Trace Id is missing
Zum Hauptinhalt wechseln

Data Lake

Ein Data Lake ohne Beschränkungen zur Unterstützung intelligenter Maßnahmen

  • Speichern und Analysieren von Dateien im Petabytebereich und in Billionen von Objekten
  • Einfaches Debuggen und Optimieren Ihrer Big Data-Programme
  • Sekundenschneller Start, sofortige Skalierung, Bezahlung pro Auftrag
  • Einfache Entwicklung hochgradig parallelisierter Programme
  • Sicherheit, Überwachung und Support auf Unternehmensniveau
  • Basierend auf YARN, konzipiert für die Cloud

Azure Data Lake umfasst alle erforderlichen Funktionen, mit denen Entwickler, Data Scientists und Analysten Daten problemlos speichern können – und zwar unabhängig von Größe, Format und Geschwindigkeit. Darüber hinaus können die Daten über verschiedene Plattformen und Programmiersprachen hinweg verarbeitet und analysiert werden. Die Lösung beseitigt die Komplexität beim Erfassen und Speichern aller Ihrer Daten. Darüber hinaus können Sie Batch-, Streaming- und interaktive Analysen jetzt noch schneller ausführen. Für eine vereinfachte Datenverwaltung und -governance kann Azure Data Lake mit vorhandenen IT-Systemen für Identitäten, Verwaltung und Sicherheit eingesetzt werden. Außerdem lässt sich der Dienst nahtlos in Betriebsdatenspeicher und Data Warehouses integrieren, damit Sie Ihre aktuellen Datenanwendungen erweitern können. Profitieren Sie von unserer Erfahrung mit Unternehmenskunden und der Umsetzung einiger der weltweit umfangreichsten Verarbeitungs- und Analyselösungen für Microsoft-Produkte wie Office 365, Xbox Live, Azure, Windows, Bing und Skype. Mit Azure Data Lake lassen sich viele Herausforderungen rund um Produktivität und Skalierbarkeit meistern, die Sie daran hindern, den Nutzen Ihrer Datenbestände voll auszuschöpfen. Mit diesem Dienst stellen wir sicher, dass Sie Ihre aktuellen und zukünftigen Geschäftsanforderungen erfüllen.

Azure Data Lake umfasst alle erforderlichen Funktionen, mit denen Entwickler, Data Scientists und Analysten Daten problemlos speichern können – und zwar unabhängig von Größe, Format und Geschwindigkeit. Darüber hinaus können die Daten über verschiedene Plattformen und Programmiersprachen hinweg verarbeitet und analysiert werden. Die Lösung beseitigt die Komplexität beim Erfassen und Speichern aller Ihrer Daten. Darüber hinaus können Sie Batch-, Streaming- und interaktive Analysen jetzt noch schneller ausführen. Für eine vereinfachte Datenverwaltung und -governance kann Azure Data Lake mit vorhandenen IT-Systemen für Identitäten, Verwaltung und Sicherheit eingesetzt werden. Außerdem lässt sich der Dienst nahtlos in Betriebsdatenspeicher und Data Warehouses integrieren, damit Sie Ihre aktuellen Datenanwendungen erweitern können. Profitieren Sie von unserer Erfahrung mit Unternehmenskunden und der Umsetzung einiger der weltweit umfangreichsten Verarbeitungs- und Analyselösungen für Microsoft-Produkte wie Office 365, Xbox Live, Azure, Windows, Bing und Skype. Mit Azure Data Lake lassen sich viele Herausforderungen rund um Produktivität und Skalierbarkeit meistern, die Sie daran hindern, den Nutzen Ihrer Datenbestände voll auszuschöpfen. Mit diesem Dienst stellen wir sicher, dass Sie Ihre aktuellen und zukünftigen Geschäftsanforderungen erfüllen.

Data Lake-Diagramm

Data Lake Analytics – ein Dienst für Analyseaufträge ohne Beschränkungen zur Unterstützung intelligenter Maßnahmen

Der erste Analysedienst in der Cloud, mit dem Sie mühelos Programme zur hochgradigen Paralleldatentransformation und -verarbeitung in U-SQL, R, Python und .NET im Petabytebereich entwickeln und ausführen können. Verarbeiten Sie Ihre Daten ohne Infrastrukturverwaltung nach Bedarf, führen Sie eine sofortige Skalierung durch, und bezahlen Sie nur pro Auftrag. Mehr erfahren

Deckblatt des Buchs „Entwicklung verteilter Systeme“

HDInsight – ein Apache Spark- und Hadoop®-Dienst für Unternehmen in der Cloud

HDInsight ist das einzige vollständig verwaltete Hadoop-Cloudangebot mit optimierten Open-Source-Analyseclustern für Spark, Hive, MapReduce, HBase, Storm, Kafka und R Server und einer SLA von 99,9 Prozent. Alle diese Big Data-Technologien und ISV-Anwendungen können ganz einfach als verwaltete Cluster mit Sicherheit und Überwachung auf Unternehmensniveau bereitgestellt werden. Mehr erfahren

Data Lake Store – ein Data Lake-Speicher ohne Beschränkungen zur Unterstützung von Big Data-Analysen

Der erste Data Lake-Speicher in der Cloud für Unternehmen, der geschützt und hochgradig skalierbar ist und auf dem offenen HDFS-Standard aufbaut. Ohne Beschränkungen der Datengröße und mit der Möglichkeit, hochgradig parallele Analysen auszuführen, können Sie nun maximalen Nutzen aus all Ihren unstrukturierten, teilweise strukturierten und strukturierten Daten ziehen. Mehr erfahren

Einfaches Entwickeln, Debuggen und Optimieren von Big Data-Programmen

Die Suche nach dem richtigen Tool für die Entwicklung und Optimierung Ihrer Big Data-Abfragen kann schwierig sein. Data Lake erleichtert diese Aufgabe durch die nahtlose Integration in Visual Studio, Eclipse und IntelliJ, damit Sie Code mit vertrauten Tools ausführen, debuggen und optimieren können. Mit Visualisierungen Ihrer U-SQL-, Apache Spark-, Apache Hive- und Apache Storm-Aufträge können Sie verfolgen, wie Ihr Code in großem Maßstab ausgeführt wird. Außerdem entdecken Sie Leistungsengpässe und Kostenoptimierungen, was die Abstimmung Ihrer Abfragen erleichtert. In unserer Ausführungsumgebung werden Ihre Programme aktiv analysiert und Empfehlungen zur Leistungsoptimierung und Kostenreduzierung bereitgestellt. Technische Fachkräfte für Daten, Datenbankadministratoren und Datenarchitekten können vorhandene Kenntnisse (z. B. SQL, Apache Hadoop, Apache Spark, R, Python, Java und .NET) nutzen, um von Anfang an produktiv zu arbeiten.

Nahtlose Integration in vorhandenen IT-Systeme

Eine der größten Herausforderungen im Zusammenhang mit Big Data ist die Integration in vorhandene IT-Systeme. Data Lake ist ein wichtiger Bestandteil von Cortana Intelligence. Folglich können Sie den Dienst zusammen mit Azure Synapse Analytics, Power BI und Data Factory einsetzen, um eine umfassende cloudbasierte Plattform für Big Data und erweiterte Analysen zu erhalten, mit der Sie von der Datenaufbereitung bis hin zu interaktiven Analysen umfangreicher Datasets alle Aufgaben bewältigen können. Mit Data Lake Analytics profitieren Sie von der optimierten Datenvirtualisierung Ihrer relationalen Quellen wie Azure SQL Server auf virtuellen Computern, Azure SQL-Datenbank oder Azure Synapse Analytics. Abfragen werden automatisch optimiert, indem die Verarbeitung ohne Datenverschiebung in der Nähe der Quelldaten stattfindet. Dadurch lässt sich die Leistung steigern und die Wartezeit minimieren. Da Data Lake in Azure bereitgestellt wird, können Sie beliebige Daten einbinden, die von Anwendungen generiert oder von Geräten in IoT-Szenarien (Internet der Dinge) erfasst wurden.

Speichern und Analysieren von Dateien im Petabytebereich und in Billionen von Objekten

Data Lake wurde von Grund auf für hohe Leistung in der Cloud entwickelt und optimiert. Mit Azure Data Lake Store kann Ihre Organisation den gesamten Datenbestand ohne künstliche Beschränkungen an einem Ort analysieren. In Ihrem Data Lake Store können Billionen von Dateien gespeichert werden, wobei eine einzelne Datei größer als ein Petabyte sein kann. Dies übersteigt die in anderen Cloudspeichern zulässige Größe um das 200-Fache. Es sind also keine Codeänderungen erforderlich, wenn Sie die Menge an gespeicherten Daten oder die bereitgestellte Computekapazität erhöhen oder verringern. Sie können sich ausschließlich auf Ihre Geschäftslogik konzentrieren und müssen nicht darüber nachdenken, wie große Datenmengen verarbeitet oder gespeichert werden. Darüber hinaus verringert Data Lake die Komplexität, die üblicherweise mit Big Data in der Cloud einhergeht. Dadurch wird sichergestellt, dass Sie Ihre aktuellen und zukünftigen Geschäftsanforderungen erfüllen werden.

Erschwinglich und kosteneffektiv

Data Lake ist eine kosteneffektive Lösung für die Ausführung von Big Data-Workloads. Bei der Datenverarbeitung haben Sie die Wahl zwischen bedarfsgesteuerten Clustern und einem Modell mit auftragsbasierter Bezahlung. In beiden Fällen benötigen Sie weder Hardware noch Lizenzen oder dienstspezifische Supportvereinbarungen. Das System wird basierend auf Ihren Geschäftsanforderungen hoch- oder herunterskaliert, sodass Sie stets nur für die tatsächlich benötigte Kapazität bezahlen. Da zudem eine unabhängige Skalierung von Speicher- und Computekapazität möglich ist, profitieren Sie von höherer wirtschaftlicher Flexibilität als bei herkömmlichen Big Data-Lösungen. Außerdem müssen Sie kein Fachteam zusammenzustellen, das üblicherweise für den Betrieb von Big Data-Infrastrukturen benötigt wird. Data Lake minimiert Ihre Kosten und maximiert gleichzeitig die Rendite Ihrer Dateninvestitionen. Eine kürzlich durchgeführte Studie hat gezeigt, dass HDInsight über einen Zeitraum von fünf Jahren 63 Prozent niedrigere Gesamtkosten als eine lokale Hadoop-Bereitstellung erzielt.

Sicherheit, Überwachung und Support auf Unternehmensniveau

Data Lake wird vollständig von Microsoft verwaltet und unterstützt. Zudem profitieren Sie von einer SLA und Supportleistungen auf Unternehmensniveau. Mit Kundensupport rund um die Uhr können Sie sich jederzeit an uns wenden, wenn Sie Hilfe bei Problemen mit Ihrer Big Data-Lösung benötigen. Unser Team übernimmt die Überwachung Ihrer Bereitstellung für Sie und stellt einen unterbrechungsfreien Betrieb sicher. Data Lake schützt Ihre Datenbestände und weitet Ihre lokalen Sicherheits- und Governancekontrollmaßnahmen problemlos in die Cloud aus. Die Daten sind immer verschlüsselt: während der Übertragung mit SSL, im Ruhezustand über den Dienst oder mit vom Benutzer verwalteten, HSM-gesicherten Schlüsseln in Azure Key Vault. Durch Azure Active Directory sind Funktionen wie Single Sign-On, Multi-Faktor-Authentifizierung und nahtlose Verwaltung von Millionen Identitäten integriert. Sie können Benutzer und Gruppen mit differenzierten POSIX-basierten Zugriffssteuerungslisten für alle Daten im Speicher autorisieren und so rollenbasierte Zugriffssteuerungen aktivieren. Schließlich können Sie Sicherheits- und Complianceanforderungen erfüllen, indem Sie jede Zugriffs- oder Konfigurationsänderung im System überwachen.

Entwickeln Sie Data Lake-Lösungen mit diesen erstklassigen Diensten

HDInsight

Stellen Sie cloudbasierte Hadoop-, Spark-, R Server-, HBase- und Storm-Cluster bereit.

Data Lake Analytics

Verteilter Analytics-Dienst zur einfachen Analyse von Big Data

Azure Data Lake Storage

Skalierbarer, sicherer Data Lake für hochleistungsfähige Analysen

Apache Hadoop® und zugehörige Open-Source-Projektnamen sind Marken der Apache Software Foundation.