Azure Data Lake Storage
Wysoce skalowalny i bezpieczny magazyn typu data lake dla obciążeń analizy o wysokiej wydajności.
Utwórz podstawy analizy o wysokiej wydajności
Wyeliminowanie silosów danych dzięki jednej platformie magazynu. Optymalizuj koszty korzystając z warstwowego magazynu i zarządzaj zasadami. Uwierzytelniaj dane przy użyciu usługi Tożsamość Microsoft Entra (dawniej Azure Active Directory) i kontroli dostępu opartej na rolach (RBAC). Pomagaj chronić dane przy użyciu funkcji zabezpieczeń, takich jak szyfrowanie w spoczynku i zaawansowana ochrona przed zagrożeniami.
Nieograniczone skalowanie i trwałość danych na poziomie 99,99999999999999% dzięki automatycznej replikacji geograficznej
Wysokie bezpieczeństwo za pomocą elastycznych mechanizmów ochrony dostępu do danych, szyfrowania i kontroli na poziomie sieci
Jedna platforma magazynu do pozyskiwania, przetwarzania i wizualizacji, która obsługuje najpopularniejsze struktury analityczne
Optymalizacja kosztów za pomocą niezależnego skalowania magazynu i zasobów obliczeniowych, zarządzanie zasadami cyklu życia i obsługa warstw na poziomie obiektów
Skalowanie w celu dopasowania do najbardziej wymagających obciążeń analitycznych
Spełniaj wszelkie wymagania dotyczące pojemności i łatwo zarządzaj danymi przy użyciu globalnej infrastruktury platformy Azure. Uruchamiaj zapytania analityczne na dużą skalę ze stałą wysoką wydajnością.
Korzystaj z elastycznych mechanizmów zabezpieczeń
Chroń swój magazyn typu data lake za pomocą funkcji obejmującym szyfrowanie, dostęp do danych i kontrolę na poziomie sieci — wszystko zaprojektowane, aby pomóc Ci w bezpieczniejszym uzyskiwaniu szczegółowych informacji.
Stwórz skalowalne podstawy dla Twoich analiz
Pozyskuj dane na dużą skalę przy użyciu szerokiej gamy narzędzi do pozyskiwania danych. Przetwarzaj dane przy użyciu usług Azure Databricks, Azure Synapse Analytics lub Azure HDInsight. Wizualizuj dane za pomocą usługi Microsoft Power BI, aby uzyskać wartościowe szczegółowe informacje.
Twórz ekonomiczne magazyny typu data lake w chmurze
Optymalizuj koszty za pomocą niezależnego skalowania magazynu i zasobów obliczeniowych, czego nie można zrobić w przypadku lokalnych magazynów typu data lake. Podnoś lub obniżaj poziom warstwy na podstawie użycia i korzystaj ze zautomatyzowanych zasad zarządzania cyklem życia na potrzeby optymalizacji kosztów magazynu.
Wbudowane funkcje kompleksowych zabezpieczeń i zgodności
-
Firma Microsoft inwestuje ponad 1 mld USD rocznie w badania i rozwiązania z zakresu cyberbezpieczeństwa.
-
Zatrudniamy ponad 3500 ekspertów w dziedzinie zabezpieczeń, którzy są skoncentrowani na ochronie danych i prywatności.
-
Elastyczne ceny dla tworzenia magazynów typu data lake
Wybieraj spośród opcji cen, w tym warstw, rezerwacji i zarządzania cyklem życia.
Rozpocznij pracę przy użyciu bezpłatnego konta platformy Azure
1
2
Po wykorzystaniu środków przejdź na płatność zgodnie z rzeczywistym użyciem, aby kontynuować pracę z użyciem tych samych bezpłatnych usług. Płacisz tylko wtedy, gdy Twoje użycie przekroczy bezpłatne miesięczne przydziały.
3
Zaufanie firm każdej wielkości
"Za pomocą platformy Azure możemy teraz szybko zwiększać wartość naszych danych. Szczegółowe informacje umożliwiające podejmowanie działań z modeli danych, które tworzymy, pomogą nam zwiększyć przychody, obniżyć koszty i zminimalizować ryzyko."
Ahmed Adnani, dyrektor ds. aplikacji i analiz, Smiths Group
"Platforma Microsoft Azure zapewnia nam wysoką wartość, gdy potrzebujemy ogromnych klastrów na kilka dni do wykonania zadania, a potem nie musimy martwić się o ich konserwację w sytuacji, gdy utrzymanie centrum danych jest niemal całkowicie nieopłacalne. To była dla nas naprawdę epokowa zmiana."
James Ferguson, menedżer produktu, Marks & Spencer
Zasoby deweloperów
Dokumentacja zawierająca instrukcje
Często zadawane pytania dotyczące usługi Data Lake Storage
-
Dodanie hierarchicznej przestrzeni nazw na wierzchu obiektów blob umożliwia zachowanie korzyści kosztowych związanych z magazynem w chmurze bez naruszania interfejsów systemu plików, dla których zostały zaprojektowane platformy analizy danych big data.
Prostym przykładem jest często występujący wzorzec zadania analizy, które zapisuje dane wyjściowe do katalogu tymczasowego, a następnie zmienia nazwę tego katalogu na ostateczną podczas fazy zatwierdzania. W magazynie obiektów (który z założenia nie obsługuje koncepcji katalogów) te zmiany nazwy mogą być długimi operacjami obejmującymi N operacji kopiowania i usuwania, gdzie N to liczba plików w katalogu. W hierarchicznej przestrzeni nazw te operacje manipulowania katalogami są niepodzielne, co poprawia wydajność i obniża koszty. Ponadto obsługa katalogów jako elementów systemu plików pozwala na stosowanie list kontroli dostępu (ACL) zgodnych ze modelem POSIX, które używają katalogów nadrzędnych do propagowania uprawnień.
-
Podobnie jak w przypadku innych usług magazynu w chmurze, opłaty za usługę Data Lake Storage są naliczane na podstawie ilości przechowywanych danych oraz wszelkich kosztów operacji wykonywanych na tych danych. Zobacz podział kosztów.
-
Usługa Data Lake Storage jest przeznaczona głównie do pracy z platformą Hadoop i wszystkimi platformami, które używają systemu plików platformy Hadoop jako warstwy dostępu do danych (na przykład Spark i Presto). Zobacz szczegóły.
Usługa Data Lake Storage na platformie Azure współdziała z następującymi elementami:
- Azure Data Factory
- Azure HDInsight
- Azure Databricks
- Azure Synapse Analytics
- Power BI
Usługa jest również uwzględniona w ekosystemie usługi Azure Blob Storage.
-
Usługa Data Lake Storage zapewnia wiele mechanizmów kontroli dostępu do danych. Oferując hierarchiczną przestrzeń nazw, usługa jest jedynym magazynem analitycznym w chmurze zawierającym listy kontroli dostępu (ACL) zgodne ze modelem POSIX, które stanowią podstawę uprawnień rozproszonego systemu plików usługi Hadoop (HDFS). Usługa Data Lake Storage obejmuje również funkcje zabezpieczeń na poziomie transportu za pomocą zapór magazynu, prywatnych punktów końcowych, wymuszania protokołu TLS 1.2 i szyfrowania w spoczynku przy użyciu kluczy dostarczonych przez system lub klienta.