Data Lake

Ein Data Lake ohne Beschränkungen zur Unterstützung intelligenter Maßnahmen

Azure Data Lake umfasst alle erforderlichen Funktionen, die Entwickler, Data Scientists und Analysten benötigen, um Daten problemlos speichern zu können – und zwar unabhängig von der Größe, vom Format und von der Geschwindigkeit der Daten. Darüber hinaus können die Daten mit Data Lake auf verschiedene Art, auf verschiedenen Plattformen und unter Verwendung verschiedener Sprachen verarbeitet und analysiert werden. Mit Data Lake gehört die Komplexität beim Erfassen und Speichern von Daten der Vergangenheit an, und mit Batch-, Streaming- und interaktiven Analysen können Sie Ihre Analysen jetzt noch schneller ausführen. Für eine vereinfachte Datenverwaltung und -governance kann Azure Data Lake mit vorhandenen IT-Systemen für Identitäten, Verwaltung und Sicherheit eingesetzt werden. Darüber hinaus lässt sich der Dienst nahtlos in Betriebsspeicher und Data Warehouses integrieren, sodass Sie Ihre aktuellen Datenanwendungen erweitern können. Profitieren Sie von unserer Erfahrung bei der Zusammenarbeit mit Unternehmenskunden und der Ausführung einiger der umfangreichsten Verarbeitungs- und Analyselösungen weltweit für Microsoft-Produkte wie Office 365, Xbox Live, Azure, Windows, Bing und Skype. Mit Azure Data Lake lassen sich diverse Herausforderungen im Zusammenhang mit Produktivität und Skalierbarkeit meistern, die Sie daran hindern, den Wert und Nutzen Ihrer Datenbestände voll auszuschöpfen. Mit diesem Dienst stellen wir sicher, dass Ihre aktuellen und zukünftigen Geschäftsanforderungen erfüllt werden.

Sehen Sie sich dieses kurze Video an, um sich einen Überblick zu verschaffen

Data Lake Analytics – ein Dienst für Analyseaufträge ohne Beschränkungen zur Unterstützung intelligenter Maßnahmen

Der erste Analysedienst in der Cloud, mit dem Sie mühelos Programme zur hochgradigen Paralleldatentransformation und -verarbeitung in U-SQL, R, Python und .NET über Petabytes von Daten entwickeln und ausführen können. Verarbeiten Sie ohne eine zu verwaltende Infrastruktur Ihre Daten nach Bedarf, führen Sie eine umgehende Skalierung durch, und bezahlen Sie nur pro Auftrag. Weitere Informationen

HDInsight – ein Apache Spark- und Hadoop®-Dienst in der Cloud für Unternehmen

HDInsight ist das einzige umfassend verwaltete Hadoop-Cloudangebot mit optimierten Open-Source-Analyseclustern für Spark, Hive, MapReduce, HBase, Storm, Kafka und R Server und einer SLA von 99,9 %. Alle diese Big Data-Technologien sowie ISV-Anwendungen können ganz einfach als verwaltete Cluster mit Sicherheit und Überwachung auf Unternehmensniveau bereitgestellt werden. Weitere Informationen

Data Lake Store – ein Data Lake-Speicher ohne Beschränkungen zur Unterstützung von Big Data-Analysen

Der erste Data Lake-Speicher in der Cloud für Unternehmen, der geschützt und hochgradig skalierbar ist und auf dem offenen HDFS-Standard aufbaut. Ohne Beschränkungen hinsichtlich der Datengröße und mit der Möglichkeit zum Ausführen hochgradiger paralleler Analysen können Sie nun einen maximalen Nutzen aus all Ihren unstrukturierten, teilweise strukturierten und strukturierten Daten ziehen. Weitere Informationen

Einfaches Entwickeln, Debuggen und Optimieren von Big Data-Programmen

Die Suche nach dem richtigen Tool für Entwurf und Optimierung Ihrer Big Data-Abfragen kann sich als schwierig erweisen. Mit Data Lake wird diese Aufgabe durch die nahtlose Integration in Visual Studio, Eclipse und IntelliJ zum Kinderspiel. Denn durch diese Integration können Sie für die Ausführung, das Debugging und die Optimierung Ihres Codes vertraute Tools nutzen. Mithilfe von Visualisierungen Ihrer U-SQL-, Apache Spark-, Apache Hive- und Apache Storm-Aufträge können Sie ermitteln, wie Ihr Code bei der Skalierung ausgeführt wird. Anhand dieser Einblicke lassen sich Leistungsengpässe ermitteln und Kosten senken, sodass die Optimierung Ihrer Abfragen vereinfacht wird. In unserer Ausführungsumgebung werden Ihre ausgeführten Programme aktiv analysiert und Empfehlungen zur Leistungsoptimierung und Kostenreduzierung bereitgestellt. Data Engineers, Datenbankadministratoren und Datenarchitekten können ihre vorhandenen Kenntnisse (z.B. SQL, Apache Hadoop, Apache Spark, R, Python, Java und .NET) nutzen, um von Anfang an produktiv mit unserer Lösung zu arbeiten.

Nahtlose Integration in Ihre vorhandenen IT-Systeme

Eine der größten Herausforderungen im Zusammenhang mit Big Data ist die Integration in vorhandene IT-Systeme. Data Lake ist ein wichtiger Bestandteil von Cortana Intelligence – dies bedeutet, dass Sie den Dienst zusammen mit Azure SQL Data Warehouse, Power BI und Data Factory einsetzen können. Damit erhalten Sie eine umfassende cloudbasierte Plattform für Big Data und erweiterte Analysen, mit der Sie sämtliche Aufgaben im Zusammenhang mit Big Data ausführen können: von der Vorbereitung der Daten bis hin zu interaktiven Analysen für umfangreiche Datasets. Mit Data Lake Analytics profitieren Sie von der optimierten Datenvirtualisierung Ihrer relationalen Quellen, z.B. Azure SQL Server auf virtuellen Computern, Azure SQL-Datenbank oder Azure SQL Data Warehouse, und können entsprechende Maßnahmen für all Ihre Daten ergreifen. Abfragen werden durch Verschiebung der Verarbeitung nah zu den Quelldaten ohne gleichzeitige Datenverschiebung automatisch optimiert. Damit einher gehen Leistungsmaximierung und Latenzminimierung. Und da Data Lake in Azure bereitgestellt wird, können Sie Daten einbinden, die von Anwendungen generiert oder von Geräten in IoT-Szenarien (Internet der Dinge) erfasst wurden.

Speichern und Analysieren von Dateien im Petabytebereich und Billionen von Objekten

Data Lake wurde von Grund auf für eine hohe Leistung in der Cloud entwickelt und optimiert. Mit Azure Data Lake Store kann Ihre Organisation ihre gesamten Daten ohne künstliche Beschränkungen an einem einzigen Ort analysieren. In Ihrem Data Lake Store können Billionen von Dateien gespeichert werden, wobei eine einzelne Datei größer als ein Petabyte sein kann. Dies übersteigt die in anderen Cloudspeichern zulässige Größe um ein 200-Faches. Das bedeutet, dass keine Codeänderungen notwendig sind, wenn Sie die Menge an gespeicherten Daten oder die bereitgestellte Computekapazität erhöhen oder verringern. So können Sie sich ausschließlich auf Ihre Geschäftslogik konzentrieren und müssen sich keinerlei Gedanken darüber machen, wie die großen Datenmengen verarbeitet oder gespeichert werden. Darüber hinaus wird mit Data Lake die Komplexität reduziert, die üblicherweise mit Big Data in der Cloud einhergeht, und wir stellen sicher, dass Ihre aktuellen und zukünftigen Geschäftsanforderungen mit diesem Dienst erfüllt werden.

Kosteneffektive Big Data-Lösung

Data Lake ist eine kosteneffektive Lösung für die Ausführung von Big Data-Workloads. Bei der Datenverarbeitung haben Sie die Wahl zwischen bedarfsgesteuerten Clustern und einem Modell mit auftragsbasierter Bezahlung. In beiden Fällen benötigen Sie weder Hardware noch Lizenzen oder dienstspezifische Supportvereinbarungen. Das System wird basierend auf Ihren Geschäftsanforderungen hoch- oder herunterskaliert, sodass Sie stets nur für die tatsächlich benötigte Kapazität bezahlen. Da zudem eine unabhängige Skalierung von Speicher- und Computekapazität möglich ist, profitieren Sie von mehr wirtschaftlicher Flexibilität als bei herkömmlichen Big Data-Lösungen. Und schließlich wird die Notwendigkeit minimiert, ein spezialisiertes Team zusammenzustellen, das üblicherweise für den Betrieb von Big Data-Infrastrukturen benötigt wird. Nutzen Sie Data Lake, um Ihre Kosten zu minimieren, während Sie gleichzeitig die Rendite Ihrer Dateninvestitionen maximieren. In einer kürzlich durchgeführten Untersuchung haben sich für HDInsight in einem Zeitraum von fünf Jahren 63 % geringere Gesamtbetriebskosten als bei der lokalen Bereitstellung von Hadoop ergeben.

Sicherheit, Überwachung und Support auf Unternehmensniveau

Data Lake wird vollständig von Microsoft verwaltet und unterstützt. Zudem profitieren Sie von einer SLA und Supportleistungen auf Unternehmensniveau. Mit Kundensupport rund um die Uhr können Sie sich jederzeit an uns wenden, wenn Sie Hilfe bei Herausforderungen oder Problemen im Zusammenhang mit Ihrer Big Data-Lösung benötigen. Unser Team übernimmt die Überwachung Ihrer Bereitstellung für Sie und stellt einen unterbrechungsfreien Betrieb sicher. Data Lake schützt Ihre Datenassets und weitet Ihre lokalen Sicherheits- und Governance-Kontrollen problemlos in die Cloud aus. Die Daten sind immer verschlüsselt: während der Übertragung mit SSL und im Ruhezustand mit über den Dienst oder vom Benutzer verwalteten HSM-gesicherten Schlüsseln in Azure Key Vault. Durch Azure Active Directory sind Funktionen wie einmaliges Anmelden (Single Sign-On, SSO), Multi-Factor Authentication und nahtlose Verwaltung von Millionen Identitäten integriert. Sie können Benutzer und Gruppen mit differenzierten POSIX-basierten Zugriffssteuerungslisten für alle Daten im Speicher autorisieren und so rollenbasierte Zugriffssteuerungen aktivieren. Schließlich können Sie Anforderungen an Sicherheit und gesetzliche Vorgaben erfüllen, indem Sie jede Zugriffs- oder Konfigurationsänderung im System überwachen.

Nutzen Sie diese erstklassigen Dienste, um Data Lake-Lösungen zu entwickeln

Apache Hadoop® und dazugehörige Open Source-Projektnamen sind Marken der Apache Software Foundation.