Pomiń nawigację

Usługa Data Lake

Usługa Data Lake bez limitów napędzająca inteligentne akcje

  • Przechowywanie i analizowanie petabajtowych plików i bilionów obiektów
  • Proste opracowywanie programów do równoległego przetwarzania danych na ogromną skalę
  • Proste debugowanie i optymalizowanie programów do obsługi danych big data
  • Obsługa, inspekcja i bezpieczeństwo klasy korporacyjnej
  • Rozpoczynanie w kilka sekund, natychmiastowe skalowanie, opłaty za poszczególne zadania
  • Zbudowana na podstawie usługi YARN i zaprojektowana dla chmury
Usługa Azure Data Lake obejmuje wszystkie możliwości ułatwiające deweloperom, osobom zajmującym się wydobywaniem danych i analitykom przechowywanie danych charakteryzowanych przez dowolny rozmiar, kształt i szybkość oraz wykonywanie wszystkich typów zadań przetwarzania i analizy na różnych platformach i w różnych językach. Eliminuje złożoności związane z przyjęciem i przechowywaniem wszystkich Twoich danych, jednocześnie przyspieszając konfigurowanie i uruchamianie analiz wsadowych, strumieniowych i interaktywnych. Usługa Azure Data Lake działa z istniejącymi technologiami IT dotyczącymi tożsamości, zarządzania i zabezpieczeń, co upraszcza zarządzanie danymi i zachowanie ich zgodności z zasadami. Integruje się także bezproblemowo z operacyjnymi magazynami i magazynami danych, dzięki czemu możesz rozszerzać obecne aplikacje danych. Skorzystaliśmy z doświadczeń nabytych podczas pracy z klientami korporacyjnymi i obsługi niektórych spośród największych rozwiązań do przetwarzania oraz analizy danych używanych przez przedsięwzięcia firmy Microsoft, takich jak pakiet Office 365, usługi Xbox Live, Bing i Skype, platforma Azure i system Windows. Usługa Azure Data Lake rozwiązuje wiele z problemów związanych z efektywnością i skalowalnością, które uniemożliwiają Ci zmaksymalizowanie wartości zasobów danych, za pomocą usługi gotowej na sprostanie Twoim obecnym i przyszłym potrzebom biznesowym.

Obejrzyj krótkie wideo zawierające przegląd funkcji

Data Lake Analytics — usługa zadań analizy bez limitów napędzająca inteligentne akcje

Pierwsza usługa analizy w chmurze, która umożliwia proste opracowywanie i uruchamianie przekształceń i programów przetwarzania równoległego na ogromną skalę w językach U-SQL, R, Python i .NET dla petabajtów danych. Brak infrastruktury do zarządzania, przetwarzanie danych na żądanie, natychmiastowe skalowanie i opłaty tylko za poszczególne zadania. Dowiedz się więcej

HDInsight — usługa Apache Spark i Hadoop® w chmurze dla przedsiębiorstwa

Usługa HDInsight jest jedyną w pełni zarządzaną ofertą platformy Hadoop w chmurze, która zapewnia zoptymalizowane klastry analityczne typu open source dla rozwiązań Spark, Hive, MapReduce, HBase, Storm, Kafka i R Server z umową SLA 99,9%. Każda z tych technologii danych big data oraz aplikacji ISV jest łatwa do wdrożenia w formie zarządzanych klastrów z bezpieczeństwem i monitorowaniem klasy korporacyjnej. Dowiedz się więcej

Data Lake Store — usługa Data Lake bez limitów napędzająca analizę danych big data

Pierwsza usługa Data Lake w chmurze dla przedsiębiorstw, która jest bezpieczna, całkowicie skalowalna i stworzona z myślą o otwartym standardzie HDFS. Brak limitu rozmiaru danych oraz możliwość uruchamiania analiz równoległych — możesz odblokować wartość wszystkich niestrukturalnych, pół strukturalnych i strukturalnych danych. Dowiedz się więcej

Proste tworzenie, debugowanie i optymalizowanie programów do obsługi danych big data

Znalezienie odpowiednich narzędzi do zaprojektowania i dostrojenia zapytań dla danych big data może być trudne. Usługa Data Lake ułatwia to dzięki zaawansowanej integracji z programem Visual Studio oraz usługami Eclipse i IntelliJ, która pozwala na korzystanie ze znajomych narzędzi do uruchamiania, debugowania i dostrajania kodu. Wizualizacje zadań technologii U-SQL, Apache Spark, Apache Hive i Apache Storm pozwalają zobaczyć, jak kod jest wykonywany na dużą skalę, oraz określić wąskie gardła wydajności i zoptymalizować koszty, co ułatwia dostrajanie zapytań. Nasze środowisko wykonywania umożliwia aktywne analizowanie Twoich programów podczas ich działania i oferuje rekomendacje dotyczące zwiększania wydajności i zmniejszania kosztów. Inżynierowie przetwarzający dane, administratorzy baz danych i architekci mogą używać swoich umiejętności z zakresu technologii SQL, Apache Hadoop, Apache Spark, R, Python, Java i .NET, dzięki czemu jest możliwa efektywna praca od pierwszego dnia.

Bezproblemowa integracja z istniejącymi rozwiązaniami IT

Jednym z największych wyzwań dotyczących rozwiązań obsługujących dane big data jest integracja z istniejącymi technologiami IT. Usługa Data Lake to kluczowa część pakietu Cortana Intelligence współdziałająca z usługami Azure Synapse Analytics, Power BI i Data Factory. Stanowi kompletną platformę do obsługi danych big data i zaawansowanych analiz w chmurze, która ułatwia wszystko — od przygotowania danych do interaktywnych analiz zestawów danych na dużą skalę. W usłudze Data Lake Analytics możesz wykonywać czynności związane ze wszystkimi swoimi danymi dzięki funkcji zoptymalizowanej wirtualizacji danych w źródłach relacyjnych, takich jak usługa Azure SQL Server na maszynach wirtualnych, Azure SQL Database i Azure Synapse Analytics. Zapytania są automatycznie optymalizowane przez przeniesienie przetwarzania bliżej źródła danych bez konieczności przenoszenia danych, a przez to maksymalizowanie wydajności i minimalizowanie opóźnień. I w końcu, ponieważ usługa Data Lake znajduje się na platformie Azure, możesz połączyć ją z dowolnymi danymi wygenerowanymi przez aplikacje lub odebranymi przez urządzenia w ramach Internetu rzeczy.

Przechowywanie i analizowanie petabajtowych plików i bilionów obiektów

Usługa Data Lake została zaprojektowana od samych podstaw pod kątem skalowalności i wydajności w chmurze. Dzięki usłudze Azure Data Lake Store Twoja organizacja może analizować wszystkie dane w jednym miejscu, bez sztucznych ograniczeń. Usługa Data Lake Store może przechowywać biliony plików, przy czym pojedynczy plik może mieć rozmiar przekraczający petabajt, czyli 200 razy więcej niż w przypadku innych magazynów w chmurze. Oznacza to, że nie musisz modyfikować kodu przy wzroście lub spadku ilości przechowywanych danych albo użytej mocy obliczeniowej. Dzięki temu możesz skoncentrować się tylko na logice biznesowej, a nie na sposobie przetwarzania i przechowywania dużych zestawów danych. Usługa Data Lake usuwa także złożoności zazwyczaj związane z danymi big data w chmurze, a Ty masz pewność, że będzie ona spełniać Twoje bieżące i przyszłe potrzeby biznesowe.

Przystępna i ekonomiczna

Usługa Data Lake to ekonomiczne rozwiązanie do uruchamiania obciążeń danymi big data. Podczas przetwarzania danych możesz wybrać między klastrami na żądanie a modelem płatności za zadania. W obu przypadkach nie jest wymagany sprzęt, licencje ani umowy pomocy technicznej dla poszczególnych usług. System skaluje się w górę lub w dół zgodnie z Twoimi potrzebami biznesowymi, co oznacza, że nigdy nie zapłacisz za więcej, niż potrzebujesz. Umożliwia także niezależne skalowanie magazynu i mocy obliczeniowej, dzięki czemu jest bardziej elastyczny ekonomicznie niż tradycyjne rozwiązania do obsługi danych big data. I w końcu minimalizuje potrzebę zatrudnienia wyspecjalizowanych zespołów, które zazwyczaj są potrzebne do obsługi infrastruktury przetwarzającej dane big data. Usługa Data Lake minimalizuje Twoje koszty, maksymalizując jednocześnie zwrot z inwestycji w dane. Ostatnie badanie wykazało, że usługa HDInsight zapewnia o 63% niższy TCO w porównaniu z lokalnym wdrażaniem platformy Hadoop w ciągu pięciu lat.

Obsługa, inspekcja i bezpieczeństwo klasy korporacyjnej

Usługa Data Lake jest w pełni zarządzana i wspierana przez firmę Microsoft oraz objęta umową SLA klasy korporacyjnej i pomocą techniczną. Dzięki całodobowej dostępności pomocy technicznej przez 7 dni w tygodniu możesz skontaktować się z nami, aby uzyskać pomoc dla zagadnień, z którymi spotykasz się Ty i całe Twoje rozwiązanie do obsługi danych big data. Nasz zespół monitoruje Twoje wdrożenie, dzięki czemu Ty nie musisz tego robić, gwarantując, że będzie działać bez przerw. Usługa Data Lake chroni Twoje zasoby danych oraz z łatwością rozszerza lokalne kontrolki bezpieczeństwa i zarządzania do wykorzystania w chmurze. Dane są zawsze szyfrowane; w ruchu przy użyciu protokołu SSL oraz w spoczynku przy użyciu kluczy opartych na module HSM zarządzanych przez usługę lub użytkownika w usłudze Azure Key Vault. Poprzez usługę Azure Active Directory zostały wbudowane różne funkcje, np. logowanie jednokrotne (SSO), uwierzytelnianie wieloskładnikowe i płynne zarządzanie milionami tożsamości. Możesz autoryzować użytkowników i grupy przy użyciu dostosowanych list ACL opartych na identyfikatorach POSIX dla wszystkich danych w usłudze Store, co umożliwia kontrolę dostępu opartą na rolach. Możesz również spełniać wymagania z zakresu bezpieczeństwa i zgodności, przeprowadzając inspekcję dla każdego dostępu lub zmiany konfiguracji w systemie.

Twórz rozwiązania usługi Data Lake, korzystając z poniższych zaawansowanych rozwiązań

HDInsight

Aprowizacja usługi Hadoop w chmurze, platformy Spark, programu R Server, bazy danych HBase i klastrów systemu Storm

Data Lake Analytics

Rozproszona usługa analizy upraszczająca obsługę danych big data

Azure Data Lake Storage

Wysoce skalowalna i bezpieczna funkcja usługi Data Lake zbudowana na bazie usługi Azure Blob Storage

Apache Hadoop® i skojarzone nazwy projektów open source są znakami towarowymi organizacji Apache Software Foundation.