Zum Hauptinhalt wechseln

Data Lake

Ein Data Lake ohne Beschränkungen zur Unterstützung intelligenter Maßnahmen

  • Speichern und Analysieren von Dateien im Petabytebereich und Billionen von Objekten
  • Unkompliziertes Entwickeln hochgradig parallelisierter Programme
  • Einfaches Debuggen und Optimieren Ihrer Big Data-Programme
  • Sicherheit, Überwachung und Support auf Unternehmensniveau
  • Start in Sekundenschnelle, sofortige Skalierung, Bezahlung pro Auftrag
  • Basierend auf YARN, konzipiert für die Cloud
Azure Data Lake umfasst alle erforderlichen Funktionen, die Entwickler, Data Scientists und Analysten benötigen, um Daten problemlos speichern zu können – und zwar unabhängig von der Größe, vom Format und von der Geschwindigkeit der Daten. Darüber hinaus können die Daten mit Data Lake auf verschiedene Art, auf verschiedenen Plattformen und unter Verwendung verschiedener Sprachen verarbeitet und analysiert werden. Mit Data Lake gehört die Komplexität beim Erfassen und Speichern von Daten der Vergangenheit an, und mit Batch-, Streaming- und interaktiven Analysen können Sie Ihre Analysen jetzt noch schneller ausführen. Für eine vereinfachte Datenverwaltung und -governance kann Azure Data Lake mit vorhandenen IT-Systemen für Identitäten, Verwaltung und Sicherheit eingesetzt werden. Darüber hinaus lässt sich der Dienst nahtlos in Betriebsspeicher und Data Warehouses integrieren, sodass Sie Ihre aktuellen Datenanwendungen erweitern können. Profitieren Sie von unserer Erfahrung bei der Zusammenarbeit mit Unternehmenskunden und der Ausführung einiger der umfangreichsten Verarbeitungs- und Analyselösungen weltweit für Microsoft-Produkte wie Office 365, Xbox Live, Azure, Windows, Bing und Skype. Mit Azure Data Lake lassen sich diverse Herausforderungen im Zusammenhang mit Produktivität und Skalierbarkeit meistern, die Sie daran hindern, den Wert und Nutzen Ihrer Datenbestände voll auszuschöpfen. Mit diesem Dienst stellen wir sicher, dass Ihre aktuellen und zukünftigen Geschäftsanforderungen erfüllt werden.

Data Lake Analytics – ein Dienst für Analyseaufträge ohne Beschränkungen zur Unterstützung intelligenter Maßnahmen

Der erste Cloudanalysedienst, mit dem Sie auf einfache Weise in großem Umfang parallele Datentransformations- und Datenverarbeitungsprogramme in U-SQL, R, Python und .NET über Petabytes an Daten entwickeln und ausführen können. Ohne dass eine Infrastruktur zu verwalten ist, können Sie Daten nach Bedarf verarbeiten, sofort skalieren und nach Auftrag zahlen. Weitere Informationen

HDInsight – ein Apache Spark- und Hadoop®-Dienst in der Cloud für Unternehmen

HDInsight ist das einzige umfassend verwaltete Hadoop-Cloudangebot mit optimierten Open-Source-Analyseclustern für Spark, Hive, MapReduce, HBase, Storm, Kafka und R Server und einer SLA von 99,9 %. Alle diese Big Data-Technologien sowie ISV-Anwendungen können ganz einfach als verwaltete Cluster mit Sicherheit und Überwachung auf Unternehmensniveau bereitgestellt werden. Weitere Informationen

Data Lake Store – ein Data Lake-Speicher ohne Beschränkungen zur Unterstützung von Big Data-Analysen

Der erste Data Lake-Speicher in der Cloud für Unternehmen, der geschützt und hochgradig skalierbar ist und auf dem offenen HDFS-Standard aufbaut. Ohne Beschränkungen hinsichtlich der Datengröße und mit der Möglichkeit zum Ausführen hochgradiger paralleler Analysen können Sie nun einen maximalen Nutzen aus all Ihren unstrukturierten, teilweise strukturierten und strukturierten Daten ziehen. Weitere Informationen

Einfaches Entwickeln, Debuggen und Optimieren von Big Data-Programmen

Die Suche nach dem richtigen Tool für Entwurf und Optimierung Ihrer Big Data-Abfragen kann sich als schwierig erweisen. Mit Data Lake wird diese Aufgabe durch die nahtlose Integration mit Visual Studio, Eclipse und IntelliJ vereinfacht, wodurch Sie für die Ausführung, das Debuggen und die Optimierung Ihres Codes vertraute Tools nutzen können. Mithilfe von Visualisierungen Ihrer U-SQL-, Apache Spark-, Apache Hive- und Apache Storm-Aufträge können Sie ermitteln, wie Ihr Code bei hoher Skalierung ausgeführt wird, und Sie können Leistungsengpässe und Kostenoptimierungen identifizieren, sodass die Optimierung Ihrer Abfragen vereinfacht wird. In unserer Ausführungsumgebung werden Ihre ausgeführten Programme aktiv analysiert und Empfehlungen zur Leistungsoptimierung und Kostenreduzierung bereitgestellt. Technische Fachkräfte für Daten, Datenbankadministratoren und Datenarchitekten können ihre vorhandenen Kenntnisse (z.B. SQL, Apache Hadoop, Apache Spark, R, Python, Java und .NET) nutzen, um vom ersten Tag an produktiv zu sein.

Nahtlose Integration in Ihre vorhandenen IT-Systeme

Eine der größten Herausforderungen im Zusammenhang mit Big Data ist die Integration in vorhandene IT-Systeme. Data Lake ist ein wichtiger Bestandteil von Cortana Intelligence – dies bedeutet, dass Sie den Dienst zusammen mit Azure Synapse Analytics, Power BI und Data Factory einsetzen können. Damit erhalten Sie eine umfassende cloudbasierte Plattform für Big Data und erweiterte Analysen, mit der Sie sämtliche Aufgaben im Zusammenhang mit Big Data ausführen können: von der Vorbereitung der Daten bis hin zu interaktiven Analysen für umfangreiche Datasets. Mit Data Lake Analytics profitieren Sie von der optimierten Datenvirtualisierung Ihrer relationalen Quellen, z.B. Azure SQL Server auf virtuellen Computern, Azure SQL-Datenbank oder Azure Synapse Analytics, und können entsprechende Maßnahmen für all Ihre Daten ergreifen. Abfragen werden durch Verschiebung der Verarbeitung nah zu den Quelldaten ohne gleichzeitige Datenverschiebung automatisch optimiert. Damit einher gehen Leistungsmaximierung und Latenzminimierung. Und da Data Lake in Azure bereitgestellt wird, können Sie Daten einbinden, die von Anwendungen generiert oder von Geräten in IoT-Szenarien (Internet der Dinge) erfasst wurden.

Speichern und Analysieren von Dateien im Petabytebereich und Billionen von Objekten

Data Lake wurde von Grund auf für Skalierung und Leistung in der Cloud konzipiert. Mit Azure Data Lake Store kann Ihr Unternehmen alle seine Daten an einem einzigen Ort ohne künstliche Einschränkungen analysieren. Ihr Data Lake Store kann Billionen von Dateien speichern, wobei eine einzelne Datei größer als ein Petabyte sein kann, was 200-mal größer ist als andere Cloud-Speicher. Dies bedeutet, dass Sie den Code nicht neu schreiben müssen, wenn Sie die Größe der gespeicherten Daten oder die Menge der hochgefahrenen Rechenleistung erhöhen oder verringern. Dadurch können Sie sich nur auf Ihre Geschäftslogik konzentrieren und nicht darauf, wie Sie große Datasets verarbeiten und speichern. Data Lake beseitigt auch die Komplexität, die normalerweise mit Big Data in der Cloud verbunden ist, und stellt sicher, dass es Ihre aktuellen und zukünftigen Geschäftsanforderungen erfüllen kann.

Kosteneffektive Big Data-Lösung

Data Lake ist eine kosteneffektive Lösung für die Ausführung von Big Data-Workloads. Bei der Datenverarbeitung haben Sie die Wahl zwischen bedarfsgesteuerten Clustern und einem Modell mit auftragsbasierter Bezahlung. In beiden Fällen benötigen Sie weder Hardware noch Lizenzen oder dienstspezifische Supportvereinbarungen. Das System wird basierend auf Ihren Geschäftsanforderungen hoch- oder herunterskaliert, sodass Sie stets nur für die tatsächlich benötigte Kapazität bezahlen. Da zudem eine unabhängige Skalierung von Speicher- und Computekapazität möglich ist, profitieren Sie von mehr wirtschaftlicher Flexibilität als bei herkömmlichen Big Data-Lösungen. Schließlich wird die Notwendigkeit minimiert, ein spezialisiertes Team einzustellen, das üblicherweise für den Betrieb von Big Data-Infrastrukturen benötigt wird. Data Lake reduziert Ihre Kosten bei gleichzeitiger Maximierung der Rendite Ihrer Dateninvestitionen. Eine kürzlich durchgeführte Studie hat gezeigt, dass HDInsight über einen Zeitraum von fünf Jahren 63 % geringere Gesamtbetriebskosten liefert als die Bereitstellung von Hadoop vor Ort.

Sicherheit, Überwachung und Support auf Unternehmensniveau

Data Lake wird vollständig von Microsoft verwaltet und unterstützt, basierend auf einem SLA und Support auf Unternehmensniveau. Mit 24/7-Kundendienst können Sie sich jederzeit an uns wenden, wenn Sie Hilfe bei Herausforderungen im Zusammenhang mit Ihrer Big Data-Lösung benötigen. Unser Team überwacht Ihre Bereitstellung für Sie und garantiert einen unterbrechungsfreien Betrieb. Data Lake schützt Ihre Datenressourcen und weitet Ihre lokalen Sicherheits- und Governance-Kontrollen problemlos in die Cloud aus. Die Daten sind immer verschlüsselt: während der Übertragung mit SSL und im Ruhezustand mit über den Dienst oder vom Benutzer verwalteten HSM-gesicherten Schlüsseln in Azure Key Vault. Durch Azure Active Directory sind Funktionen wie einmaliges Anmelden (Single Sign-On, SSO), Multi-Faktor-Authentifizierung und nahtlose Verwaltung von Millionen Identitäten integriert. Sie können Benutzer und Gruppen mit differenzierten POSIX-basierten Zugriffssteuerungslisten für alle Daten im Store autorisieren und so rollenbasierte Zugriffssteuerungen aktivieren. Schließlich können Sie Anforderungen an Sicherheit und gesetzliche Vorgaben erfüllen, indem Sie jede Zugriffs- oder Konfigurationsänderung im System überwachen.

Nutzen Sie diese erstklassigen Dienste, um Data Lake-Lösungen zu entwickeln

HDInsight

Cloudbasierte Hadoop-, Spark-, R Server-, HBase- und Storm-Cluster bereitstellen

Data Lake Analytics

Verteilter Analysedienst zur vereinfachten Analyse von Big Data

Azure Data Lake Storage

Skalierbare, sichere Data Lake-Funktionen für Hochleistungsanalysen

Apache Hadoop® und dazugehörige Open Source-Projektnamen sind Marken der Apache Software Foundation.

Können wir Ihnen helfen?