Trace Id is missing
Przejdź do głównej zawartości

Data Lake

Usługa Data Lake bez limitów napędza inteligentne działania.

  • Przechowywanie i analizowanie petabajtowych plików i bilionów obiektów
  • Proste debugowanie i optymalizowanie programów do obsługi danych big data
  • Rozpoczynanie w kilka sekund, natychmiastowe skalowanie, opłaty za poszczególne zadania
  • Proste opracowywanie programów do równoległego przetwarzania danych na ogromną skalę
  • Obsługa, inspekcja i bezpieczeństwo klasy korporacyjnej
  • Zbudowana na podstawie usługi YARN i zaprojektowana dla chmury

Usługa Azure Data Lake obejmuje wszystkie możliwości ułatwiające deweloperom, badaczom danych i analitykom przechowywanie danych o dowolnym rozmiarze, kształcie i dowolnej szybkości oraz wykonywanie wszystkich typów zadań przetwarzania i analizy na różnych platformach i w różnych językach. Eliminuje złożoności związane z pozyskiwaniem i przechowywaniem wszystkich danych, jednocześnie przyspieszając konfigurowanie i uruchamianie analiz wsadowych, strumieniowych i interaktywnych. Usługa Azure Data Lake działa z istniejącymi technologiami IT dotyczącymi tożsamości, zarządzania i zabezpieczeń, co upraszcza zarządzanie danymi i zachowanie ładu. Integruje się także bezproblemowo z magazynami operacyjnymi i magazynami danych, dzięki czemu możesz rozszerzać obecne aplikacje danych. Skorzystaliśmy z doświadczeń nabytych podczas pracy z klientami korporacyjnymi i obsługiwania niektórych spośród największych rozwiązań do przetwarzania oraz analizy danych stosowanych w rozwiązaniach firmy Microsoft, takich jak usługi Office 365, Xbox Live, Bing i Skype, platforma Azure i system Windows. Usługa Azure Data Lake rozwiązuje wiele z problemów związanych z efektywnością i skalowalnością, które uniemożliwiają Ci zmaksymalizowanie wartości zasobów danych, za pomocą usługi gotowej na sprostanie Twoim obecnym i przyszłym potrzebom biznesowym.

Usługa Azure Data Lake obejmuje wszystkie możliwości ułatwiające deweloperom, badaczom danych i analitykom przechowywanie danych o dowolnym rozmiarze, kształcie i dowolnej szybkości oraz wykonywanie wszystkich typów zadań przetwarzania i analizy na różnych platformach i w różnych językach. Eliminuje złożoności związane z pozyskiwaniem i przechowywaniem wszystkich danych, jednocześnie przyspieszając konfigurowanie i uruchamianie analiz wsadowych, strumieniowych i interaktywnych. Usługa Azure Data Lake działa z istniejącymi technologiami IT dotyczącymi tożsamości, zarządzania i zabezpieczeń, co upraszcza zarządzanie danymi i zachowanie ładu. Integruje się także bezproblemowo z magazynami operacyjnymi i magazynami danych, dzięki czemu możesz rozszerzać obecne aplikacje danych. Skorzystaliśmy z doświadczeń nabytych podczas pracy z klientami korporacyjnymi i obsługiwania niektórych spośród największych rozwiązań do przetwarzania oraz analizy danych stosowanych w rozwiązaniach firmy Microsoft, takich jak usługi Office 365, Xbox Live, Bing i Skype, platforma Azure i system Windows. Usługa Azure Data Lake rozwiązuje wiele z problemów związanych z efektywnością i skalowalnością, które uniemożliwiają Ci zmaksymalizowanie wartości zasobów danych, za pomocą usługi gotowej na sprostanie Twoim obecnym i przyszłym potrzebom biznesowym.

diagram usługi data lake

Data Lake Analytics — usługa zadań analizy bez limitów napędzająca inteligentne działania

Pierwsza usługa analizy w chmurze, która umożliwia proste opracowywanie i uruchamianie przekształceń i programów przetwarzania równoległego na ogromną skalę w językach U-SQL, R, Python i .NET dla petabajtów danych. Brak infrastruktury do zarządzania, przetwarzanie danych na żądanie, natychmiastowe skalowanie i opłaty tylko za poszczególne zadania. Dowiedz się więcej

Okładka książki Designing Distributed Systems (Projektowanie systemów rozproszonych)

HDInsight — chmurowa usługa Apache Spark i Hadoop® dla przedsiębiorstw

Usługa HDInsight jest jedyną w pełni zarządzaną ofertą platformy Hadoop w chmurze, która zapewnia zoptymalizowane klastry analityczne typu open source dla rozwiązań Spark, Hive, MapReduce, HBase, Storm, Kafka i R Server z umową SLA 99,9%. Każda z tych technologii danych big data oraz aplikacji ISV jest łatwa do wdrożenia w formie zarządzanych klastrów z bezpieczeństwem i monitorowaniem klasy korporacyjnej. Dowiedz się więcej

Data Lake Store — usługa Data Lake bez limitów napędzająca analizę danych big data

Pierwsza usługa data lake w chmurze dla przedsiębiorstw, która jest bezpieczna, całkowicie skalowalna i stworzona z myślą o otwartym standardzie HDFS. Brak limitu rozmiaru danych oraz możliwość uruchamiania analiz równoległych — możesz odblokować wartość wszystkich niestrukturalnych, częściowo strukturalnych i strukturalnych danych. Dowiedz się więcej

Proste tworzenie, debugowanie i optymalizowanie programów do obsługi danych big data

Znalezienie odpowiednich narzędzi do zaprojektowania i dostrojenia zapytań dla danych big data może być trudne. Usługa Data Lake ułatwia to dzięki zaawansowanej integracji z programem Visual Studio oraz usługami Eclipse i IntelliJ, która pozwala na korzystanie ze znajomych narzędzi do uruchamiania, debugowania i dostrajania kodu. Wizualizacje zadań technologii U-SQL, Apache Spark, Apache Hive i Apache Storm pozwalają zobaczyć, jak kod jest wykonywany na dużą skalę, oraz określić wąskie gardła wydajności i zoptymalizować koszty, co ułatwia dostrajanie zapytań. Nasze środowisko wykonywania umożliwia aktywne analizowanie Twoich programów podczas ich działania i oferuje rekomendacje dotyczące zwiększania wydajności i zmniejszania kosztów. Inżynierowie przetwarzający dane, administratorzy baz danych i architekci mogą używać swoich umiejętności z zakresu technologii SQL, Apache Hadoop, Apache Spark, R, Python, Java i .NET, dzięki czemu mogą pracować efektywnie od pierwszego dnia.

Bezproblemowa integracja z istniejącymi rozwiązaniami IT

Jednym z największych wyzwań dotyczących rozwiązań obsługujących dane big data jest integracja z istniejącymi technologiami IT. Usługa Data Lake to kluczowa część pakietu Cortana Intelligence współdziałająca z usługami Azure Synapse Analytics, Power BI i Data Factory. Stanowi kompletną platformę do obsługi danych big data i zaawansowanych analiz w chmurze, która ułatwia wszystko — od przygotowania danych do interaktywnych analiz zestawów danych na dużą skalę. W usłudze Data Lake Analytics możesz wykonywać czynności związane ze wszystkimi swoimi danymi dzięki funkcji zoptymalizowanej wirtualizacji danych w źródłach relacyjnych, takich jak usługa Azure SQL Server na maszynach wirtualnych, Azure SQL Database i Azure Synapse Analytics. Zapytania są automatycznie optymalizowane przez przeniesienie przetwarzania bliżej źródła danych bez konieczności przenoszenia danych, co pozwala zmaksymalizować wydajność i zminimalizować opóźnienia. I w końcu, ponieważ usługa Data Lake znajduje się na platformie Azure, możesz połączyć ją z dowolnymi danymi wygenerowanymi przez aplikacje lub odebranymi przez urządzenia w ramach Internetu rzeczy.

Przechowywanie i analizowanie petabajtowych plików i bilionów obiektów

Usługa Data Lake została zaprojektowana od samych podstaw pod kątem skalowalności i wydajności w chmurze. Dzięki usłudze Azure Data Lake Store Twoja organizacja może analizować wszystkie dane w jednym miejscu, bez sztucznych ograniczeń. Usługa Data Lake Store może przechowywać biliony plików, przy czym pojedynczy plik może mieć rozmiar przekraczający petabajt, czyli 200 razy więcej niż w przypadku innych magazynów w chmurze. Oznacza to, że nie musisz modyfikować kodu przy wzroście lub spadku ilości przechowywanych danych albo użytej mocy obliczeniowej. Dzięki temu możesz skoncentrować się tylko na logice biznesowej, a nie na sposobie przetwarzania i przechowywania dużych zestawów danych. Usługa Data Lake usuwa także złożoności zazwyczaj związane z danymi big data w chmurze, a Ty masz pewność, że będzie ona spełniać Twoje bieżące i przyszłe potrzeby biznesowe.

Przystępna i ekonomiczna

Usługa Data Lake to ekonomiczne rozwiązanie do uruchamiania obciążeń danych big data. Podczas przetwarzania danych możesz wybrać między klastrami na żądanie a modelem płatności za zadania. W obu przypadkach nie jest wymagany sprzęt, licencje ani umowy pomocy technicznej dla poszczególnych usług. System skaluje się w górę lub w dół zgodnie z Twoimi potrzebami biznesowymi, co oznacza, że nigdy nie zapłacisz za więcej, niż potrzebujesz. Umożliwia także niezależne skalowanie magazynu i mocy obliczeniowej, dzięki czemu jest bardziej elastyczny ekonomicznie niż tradycyjne rozwiązania do obsługi danych big data. I w końcu minimalizuje potrzebę zatrudnienia wyspecjalizowanych zespołów, które zazwyczaj są potrzebne do obsługi infrastruktury przetwarzającej dane big data. Usługa Data Lake minimalizuje Twoje koszty, maksymalizując jednocześnie zwrot z inwestycji w dane. Ostatnie badanie wykazało, że usługa HDInsight zapewnia o 63% niższy całkowity koszt posiadania w porównaniu z lokalnym wdrażaniem platformy Hadoop w ciągu pięciu lat.

Obsługa, inspekcja i bezpieczeństwo klasy korporacyjnej

Usługa Data Lake jest w pełni zarządzana i wspierana przez firmę Microsoft oraz objęta umową SLA klasy korporacyjnej i pomocą techniczną. Dzięki całodobowej dostępności pomocy technicznej przez 7 dni w tygodniu możesz skontaktować się z nami, aby uzyskać pomoc w zakresie wyzwań dotyczących całego rozwiązania do obsługi danych big data. Nasz zespół monitoruje Twoje wdrożenie, dzięki czemu nie musisz tego robić samodzielnie, gwarantując, że będzie działać bez przerw. Usługa Data Lake chroni Twoje zasoby danych oraz z łatwością rozszerza lokalne mechanizmy kontroli bezpieczeństwa i zarządzania do wykorzystania w chmurze. Dane są zawsze szyfrowane; w ruchu przy użyciu protokołu SSL oraz w spoczynku przy użyciu kluczy opartych na module HSM zarządzanych przez usługę lub użytkownika w usłudze Azure Key Vault. Usługa Azure Active Directory zapewnia dostępność różnorodnych funkcji, takich jak logowanie jednokrotne (SSO), uwierzytelnianie wieloskładnikowe i płynne zarządzanie milionami tożsamości. Możesz autoryzować użytkowników i grupy przy użyciu dostosowanych list ACL opartych na identyfikatorach POSIX dla wszystkich danych w usłudze Store, co umożliwia kontrolę dostępu opartą na rolach. Możesz również spełniać wymagania z zakresu bezpieczeństwa i zgodności, przeprowadzając inspekcję dla każdego dostępu lub zmiany konfiguracji w systemie.

Twórz rozwiązania usługi Data Lake, korzystając z poniższych zaawansowanych rozwiązań

HDInsight

Aprowizacja usługi Hadoop w chmurze, platformy Spark, programu R Server, bazy danych HBase i klastrów systemu Storm.

Data Lake Analytics

Rozproszona usługa analizy upraszczająca obsługę danych big data.

Azure Data Lake Storage

Skalowalne, bezpieczne magazyny typu data lake na potrzeby analizy o wysokiej wydajności.

Apache Hadoop® i skojarzone nazwy projektów open source są znakami towarowymi organizacji Apache Software Foundation.