Pomiń nawigację

Azure Data Lake Storage

Wysoce skalowalna i bezpieczna funkcja usługi Data Lake zbudowana na bazie usługi Azure Blob Storage

Uzyskaj funkcjonalność wydajnej usługi typu Data Lake w skali chmury

Usługa Azure Data Lake Storage 2. generacji to wysoce skalowalne i ekonomiczne rozwiązanie typu Data Lake do analizy danych big data. Połączono w niej wysoce wydajny system plików z ogromną skalą i przystępnością cenową, aby przyspieszyć uzyskiwanie szczegółowych informacji. Usługa Data Lake Storage 2. generacji rozszerza możliwości usługi Azure Blob Storage i jest zoptymalizowana pod kątem obciążeń analitycznych. Usługa Azure Data Lake Storage 2. generacji to najbardziej kompletna z dostępnych usług typu Data Lake.

Przeczytaj blog

Zobacz więcej wideo

Szybkość

Testuj modele szybciej dzięki zgodnemu z usługą Hadoop systemowi plików, który obsługuje operacje niepodzielne na plikach i folderach oraz jest zoptymalizowany pod kątem błyskawicznego wykonywania zadań.

Skalowalność

Rozszerzaj globalną skalę, trwałość i wydajność usługi Azure Blob Storage i uzyskaj obsługę kont magazynów o olbrzymiej pojemności.

Bezpieczeństwo

Spełnij najbardziej rygorystyczne wymagania w zakresie zabezpieczeń danych przedsiębiorstwa dzięki takim narzędziom i zasobom, jak precyzyjne listy kontroli dostępu zgodne z biblioteką POSIX, zabezpieczenia magazynu obiektów z szyfrowaniem magazynowanych danych, integracja z usługą Azure Active Directory oraz zapory kont magazynu.

Efektywność kosztowa

Uzyskaj funkcje typu Data Lake na poziomach cen za magazyn obiektów w chmurze. Usługa Data Lake Storage Gen2 oferuje takie samo zarządzanie zasadami cyklu życia i dzielenie na warstwy na poziomie obiektów co wbudowane w usługę Blob Storage.

Możliwości usługi

Ogromna skalowalność

Prawie nieograniczony magazyn na dane analizy

Cennik magazynu obiektów w chmurze

Ten sam atrakcyjny cenowo model magazynu co w przypadku usługi Azure Blob Storage

Mniej transakcji na plikach i folderach

Niepodzielne transakcje pozwalające zmniejszyć liczbę cykli obliczeniowych i przyspieszyć wykonywanie zadań

Szczegółowa kontrola nad plikami i folderami

Precyzyjne listy kontroli dostępu (ACL) zgodne z biblioteką POSIX

Uproszczone pozyskiwanie w pojedynczym magazynie

Skonsolidowany magazyn danych używający usługi Data Lake Storage Gen2 lub interfejsu API REST usługi Blob Storage

Pełny zestaw funkcji usługi Azure Blob Storage

Zarządzanie zasadami cyklu życia danych; warstwy Gorąca, Chłodna i Archiwum; obsługa wysokiej dostępności i odzyskiwania po awarii

Dostęp oparty na rolach i zapory konta magazynu

Wielowarstwowe zabezpieczenia pozwalają nadzorować dostęp do danych w taki sposób, aby analizę mogli przeprowadzać tylko użytkownicy z autoryzowanych adresów IP

Obsługa modelu Common Data Model (CDM)

Możliwość wymiany danych z zaawansowanymi aplikacjami, takimi jak Microsoft Dynamics 365 (dla CRM) i Power BI

Zaufani partnerzy

  • Informatica Cloud
  • Attunity
  • WANDisco
  • Striim
  • Qubole
  • Cloudera

Co umożliwia usługa Data Lake Storage?

Nowoczesny magazyn danych

Modern data warehouseA modern data warehouse lets you bring together all your data at any scale easily, and to get insights through analytical dashboards, operational reports, or advanced analytics for all your users.12354
  1. Przegląd
  2. Przepływ

Przegląd

Nowoczesny magazyn danych umożliwia łatwe łączenie wszystkich typów danych o dowolnej skali oraz udostępnia wszystkim użytkownikom szczegółowe informacje za pomocą analitycznych pulpitów nawigacyjnych, raportów operacyjnych i analizy zaawansowanej.

Przepływ

  1. 1 Połącz wszystkie swoje dane — strukturalne, nie mające określonej struktury i częściowo ustrukturyzowane (dzienniki, pliki i multimedia) — przy użyciu usług Azure Data Factory i Azure Blob Storage.
  2. 2 Wykorzystaj dane z usługi Azure Blob Storage w celu przeprowadzenia skalowalnej analizy w usłudze Azure Databricks i uzyskania oczyszczonych oraz przekształconych danych.
  3. 3 Oczyszczone i przekształcone dane można przenieść do usługi Azure SQL Data Warehouse i połączyć z istniejącymi danymi strukturalnymi, tworząc jedno centrum dla wszystkich danych. Wykorzystaj natywne łączniki między usługami Azure Databricks i Azure SQL Data Warehouse, aby móc uzyskać dostęp do danych na dużą skalę i przenosić je.
  4. 4 Twórz raporty operacyjne i analityczne pulpity nawigacyjne bazujące na usłudze Azure Data Warehouse, aby na podstawie danych uzyskać szczegółowe informacje, a następnie skorzystaj z usług Azure Analysis Services w celu udostępnienia tych informacji użytkownikom końcowym.
  5. 5 Uruchamiaj zapytania ad hoc bezpośrednio na danych z usługi Azure Databricks.

Zaawansowana analiza danych big data

Advanced analytics on big dataTransform your data into actionable insights using the best in class machine learning tools. This architecture allows you to combine any data at any scale, and to build and deploy custom machine learning models at scale.1234576
  1. Przegląd
  2. Przepływ

Przegląd

Przekształcaj dane w szczegółowe informacje wskazujące czynności do wykonania przy użyciu najlepszych w swojej klasie narzędzi do uczenia maszynowego. Ta architektura umożliwia łączenie dowolnych danych w dowolnej skali oraz tworzenie i wdrażanie niestandardowych modeli uczenia maszynowego w dużej skali.

Przepływ

  1. 1 Zbierz wszystkie swoje dane — strukturalne, nie mające określonej struktury i częściowo ustrukturyzowane (dzienniki, pliki i multimedia) — przy użyciu usług Azure Data Factory i Azure Blob Storage.
  2. 2 Użyj usługi Azure Databricks, aby wyczyścić i przekształcić zestawy danych nie mających określonej struktury, a także połączyć je z danymi strukturalnymi z operacyjnych baz danych lub magazynów danych.
  3. 3 Użyj skalowalnego uczenia maszynowego/technik uczenia głębokiego, aby uzyskać bardziej szczegółowe informacje z tych danych za pomocą języka Python, R lub Scala oraz wbudowanych środowisk notesów w usłudze Azure Databricks.
  4. 4 Wykorzystaj natywne łączniki między usługami Azure Databricks i Azure SQL Data Warehouse, aby móc uzyskać dostęp do danych na dużą skalę i przenosić je.
  5. 5 Zaawansowani użytkownicy korzystają z wbudowanych możliwości usługi Azure Databricks w celu określenia głównych przyczyn i przeanalizowania surowych danych.
  6. 6 Uruchamiaj zapytania ad hoc bezpośrednio na danych z usługi Azure Databricks.
  7. 7 Umieść szczegółowe informacje z usługi Azure Databricks w bazie danych Cosmos DB, aby udostępnić je za pośrednictwem aplikacji internetowych i mobilnych.

Analiza w czasie rzeczywistym

Real-time analyticsGet insights from live, streaming data with ease. Capture data continuously from any IoT device or logs from website clickstreams and process it in near-real time.12348765
  1. Przegląd
  2. Przepływ

Przegląd

Łatwo uzyskuj szczegółowe informacje z danych przesyłanych strumieniowo na żywo. Przechwytuj ciągle dane z dowolnego urządzenia IoT lub z dzienników ze strumienia kliknięć z witryn internetowych i przetwarzaj je niemal w czasie rzeczywistym.

Przepływ

  1. 1 Łatwo pozyskuj dane transmisji strumieniowej na żywo dla aplikacji przy użyciu klastra Apache Kafka w usłudze Azure HDInsight.
  2. 2 Zbierz razem wszystkie dane strukturalne w usłudze Azure Blob Storage, korzystając z usługi Azure Data Factory.
  3. 3 Skorzystaj z usługi Azure Databricks, aby wyczyścić, przekształcić i przeanalizować dane przesyłane strumieniowo, a także połączyć je z danymi strukturalnymi z operacyjnych baz danych lub magazynów danych.
  4. 4 Użyj skalowalnego uczenia maszynowego/technik uczenia głębokiego, aby uzyskać bardziej szczegółowe informacje z tych danych za pomocą języka Python, R lub Scala oraz wbudowanych środowisk notesów w usłudze Azure Databricks.
  5. 5 Wykorzystaj natywne łączniki między usługami Azure Databricks i Azure SQL Data Warehouse, aby móc uzyskać dostęp do danych na dużą skalę i przenosić je.
  6. 6 Utwórz analityczne pulpity nawigacyjne i osadzone raporty bazujące na usłudze Azure Data Warehouse, aby udostępnić szczegółowe informacje w obrębie organizacji, a następnie użyj usług Azure Analysis Services w celu udostępnienia tych danych tysiącom użytkowników.
  7. 7 Zaawansowani użytkownicy korzystają z wbudowanych możliwości usług Azure Databricks i Azure HDInsight w celu określenia głównych przyczyn i przeanalizowania surowych danych.
  8. 8 Umieść szczegółowe informacje z usługi Azure Databricks w bazie danych Cosmos DB, aby udostępnić je za pośrednictwem aplikacji działających w czasie rzeczywistym.

Powiązane produkty i usługi

Azure Databricks

Szybka i łatwa w obsłudze platforma analityczna do pracy zespołowej bazująca na projekcie Apache Spark

Data Factory

Prosta integracja danych hybrydowych na skalę przedsiębiorstwa

SQL Data Warehouse

Elastyczny magazyn danych jako usługa oferująca funkcje klasy korporacyjnej

Wprowadzenie do usługi Azure Data Lake Store