Azure Databricks

Szybka i łatwa w obsłudze usługa analityczna do pracy zespołowej oparta na platformie Apache SparkTM

Analiza danych big data oraz sztucznej inteligencji dzięki zoptymalizowanemu środowisku Apache Spark

Uzyskuj szczegółowe informacje ze wszystkich swoich danych i twórz rozwiązania sztucznej inteligencji w usłudze Azure Databricks. Skonfiguruj środowisko Apache Spark™ w kilka minut, skaluj je automatycznie i pracuj nad wspólnymi projektami w interaktywnym obszarze roboczym. Usługa Azure Databricks obsługuje języki Python, Scala, R, Java i SQL, a także struktury i biblioteki nauki o danych takie jak TensorFlow, PyTorch i scikit-learn.

Apache Spark™ to znak towarowy organizacji Apache Software Foundation.

Niezawodna inżynieria danych

Przetwarzanie danych w dużej skali na potrzeby obciążeń wsadowych i przesyłania strumieniowego

Analiza wszystkich danych

Analizuj najbardziej kompletne i aktualne dane

Nauka o danych we współpracy z innymi osobami

Uprość i przyspiesz procesy nauki o danych w dużych zestawach danych

Rozwiązanie oparte na oprogramowaniu typu „open source”

Szybkie, zoptymalizowane środowisko platformy Apache Spark

Szybko rozpocznij pracę w zoptymalizowanym środowisku Apache Spark

Usługa Azure Databricks udostępnia najnowsze wersje środowiska Apache Spark i umożliwia bezproblemową integrację z bibliotekami typu open source. Uruchamiaj klastry i szybko kompiluj we w pełni zarządzanym środowisku Apache Spark, korzystając z globalnej skali i dostępności platformy Azure. Klastry są instalowane, konfigurowane i dostosowywane tak, aby zapewniały niezawodność i wydajność bez konieczności monitorowania. Wykorzystaj automatyczne skalowanie i kończenie w celu optymalizacji całkowitego kosztu posiadania.

Zapoznaj się z dokumentacją usługi Azure Databricks

Zwiększ produktywność dzięki współdzielonemu obszarowi roboczemu i popularnym językom

Skutecznie współpracuj nad wspólnymi projektami, korzystając z interaktywnego obszaru roboczego i środowiska notesów — bez względu na to, czy jesteś inżynierem danych, analitykiem danych, czy analitykiem biznesowym. Kompiluj w wybranym języku, na przykład Python, Scala, R, czy SQL. Łatwo uzyskaj kontrolę wersji notesów dzięki serwisowi GitHub i metodologii DevOps.

Dowiedz się, jak utworzyć obszar roboczy usługi Azure Databricks

Usprawnij uczenie maszynowe na podstawie danych big data

Uzyskaj dostęp do zaawansowanych możliwości zautomatyzowanego uczenia maszynowego przy użyciu zintegrowanej usługi Azure Machine Learning w celu szybkiego identyfikowania odpowiednich algorytmów i hiperparametrów. Uprość monitorowanie i aktualizowanie modeli uczenia maszynowego wdrożonych z chmury na urządzenia brzegowe oraz zarządzanie nimi. Usługa Azure Machine Learning zapewnia również centralny rejestr na potrzeby eksperymentów, potoków uczenia maszynowego i modeli.

Obejrzyj seminarium internetowe dotyczące usług Azure Databricks i Azure Machine Learning

Uzyskaj nowoczesny magazyn danych o wysokiej wydajności

Łącz dane na dowolną skalę i uzyskuj analizy za pośrednictwem analitycznych pulpitów nawigacyjnych i raportów operacyjnych. Zautomatyzuj przenoszenie danych przy użyciu usługi Azure Data Factory, ładuj dane do usługi Azure Data Lake Storage, przekształcaj je i oczyszczaj w usłudze Azure Databricks, a następnie udostępniaj je do analizy za pomocą usługi Azure Synapse Analytics. Unowocześnij magazyn danych w chmurze, aby osiągnąć niezrównany poziom wydajności i skalowalności.

Dowiedz się więcej o funkcjach analizy w skali chmury na platformie Azure

Najważniejsze możliwości usługi

Zoptymalizowany aparat Spark

Korzystaj z prostego przetwarzania danych w automatycznie skalowanej architekturze, obsługiwanej przez wysoce zoptymalizowany aparat Apache Spark™, aby uzyskać nawet 50-krotny wzrost wydajności.

Czas wykonywania uczenia maszynowego

Uzyskuj dostęp za pomocą jednego kliknięcia do wstępnie skonfigurowanych środowisk uczenia maszynowego, aby rozszerzyć uczenie maszynowe przy użyciu nowoczesnych i popularnych struktur takich jak PyTorch, TensorFlow czy scikit-learn.

MLflow

Śledź i udostępniaj eksperymenty, odtwarzaj przebiegi i wspólnie zarządzaj modelami z poziomu centralnego repozytorium.

Wybór języka

Używaj preferowanego języka, na przykład Python, Scala, R, Spark SQL, czy .Net, niezależnie od tego, czy korzystasz z bezserwerowych, czy aprowizowanych zasobów obliczeniowych.

Notesy do współpracy

Szybko uzyskuj dostęp do danych, eksploruj je, uzyskuj i udostępniaj nowe analizy oraz twórz modele we współpracy z innymi osobami, korzystając z wybranych języków i narzędzi.

Delta Lake

Zapewnij niezawodność i skalowalność danych w istniejącym magazynie typu data lake, korzystając z transakcyjnej warstwy magazynu typu open source, zaprojektowanej z myślą o całym cyklu życia danych.

Natywna integracja z usługami platformy Azure

Uzupełnij swoje kompleksowe rozwiązanie do analizy i uczenia maszynowego dzięki głębokiej integracji z usługami platformy Azure takimi jak Azure Data Factory, Azure Data Lake Storage, Azure Machine Learning i Power BI.

Interaktywne obszary robocze

Umożliwiają bezproblemową współpracę między analitykami danych, inżynierami danych i analitykami biznesowymi.

Bezpieczeństwo klasy korporacyjnej

Łatwe w użyciu zabezpieczenia natywne chronią dane tam, gdzie się znajdują, tworząc zgodne, prywatne, izolowane obszary robocze analiz obejmujące tysiące użytkowników i zestawów danych.

Gotowe do zastosowań produkcyjnych

Bez obaw uruchamiaj i skaluj obciążenia danych o znaczeniu krytycznym na zaufanej platformie danych zintegrowanej z ekosystemem rozwiązań do monitorowania oraz ciągłej integracji/ciągłego wdrażania.

Dowiedz się więcej z przykładów architektury rozwiązań

Analiza w czasie rzeczywistym w ramach architektury danych big data

Łatwo uzyskuj analizy danych przesyłanych strumieniowo na żywo. Przechwytuj ciągle dane z dowolnego urządzenia IoT lub z dzienników ze strumienia kliknięć z witryn internetowych i przetwarzaj je niemal w czasie rzeczywistym.

Zaawansowana architektura analizy

Przekształcaj dane w szczegółowe informacje wskazujące czynności do wykonania przy użyciu najlepszych w swojej klasie narzędzi do uczenia maszynowego. Ta architektura umożliwia łączenie dowolnych danych w dowolnej skali oraz tworzenie i wdrażanie niestandardowych modeli uczenia maszynowego w dużej skali.

Zarządzanie cyklem życia uczenia maszynowego

Przyspiesz cały cykl uczenia maszynowego i zarządzaj nim, korzystając z usług Azure Databricks, MLflow i Azure Machine Learning do tworzenia, udostępniania i wdrażania aplikacji uczenia maszynowego oraz do zarządzania nimi.

Bezkompromisowe zabezpieczenia danych i ochrona prywatności

  • Zabezpieczaj i monitoruj dane oraz rozwiązania analityczne i zarządzaj nimi, korzystając z szerokiej gamy wiodących w branży funkcji zabezpieczeń i zgodności.

  • Wdróż logowanie jednokrotne i integrację z usługą Azure Active Directory, aby specjaliści ds. danych mogli poświęcać więcej swojego czasu na odkrywcze analizy.

  • Platforma Azure ma więcej certyfikatów niż każdy inny dostawca usług w chmurze. Wyświetl pełną listę.

Dowiedz się więcej o produktach i usługach Azure Databricks

Cennik usługi Azure Databricks

Zaufanie firm z różnych branż

Identyfikowanie zagrożeń bezpieczeństwa przy użyciu uczenia głębokiego w chmurze

Firma Shell korzysta z platformy Azure, sztucznej inteligencji i maszynowego przetwarzania obrazów, aby lepiej chronić klientów i pracowników.

Przeczytaj historię

Shell

Lepsza wydajność i większe oszczędności

Usługa danych renewables.AI korzysta z platform Azure i Apache Spark, aby zwiększyć stabilność i zyskowność na rynku energii słonecznej.

Przeczytaj historię

Renewables AI

Kompleksowe rozwiązanie do analizy na platformie Azure

Dostawca logistyki LINX Cargo Care Group wdraża innowacyjne rozwiązania w całej firmie dzięki usłudze Azure Databricks.

Przeczytaj historię

LINX Cargo Care Group

Rozpoczynanie pracy z usługą Azure Databricks

Utwórz bezpłatne konto platformy Azure, aby uzyskać natychmiastowy dostęp.

Przeczytaj dokumentację, aby dowiedzieć się, jak korzystać z usługi Azure Databricks.

Zapoznaj się z przewodnikiem Szybki start, aby utworzyć klaster, notes, tabelę i nie tylko.

Społeczność i pomoc techniczna platformy Azure

Zadawaj pytania i uzyskuj pomoc od inżynierów firmy Microsoft oraz ekspertów ze społeczności platformy Azure na Forum MSDN i w witrynie Stack Overflow lub skontaktuj się z pomocą techniczną platformy Azure.

Popularne laboratoria i szablony

Odkryj realizowane samodzielnie laboratoria i popularne szablony przewodników Szybki start dla typowych konfiguracji przygotowane przez firmę Microsoft oraz społeczność.

Pobierz najnowsze wiadomości i zasoby dotyczące usługi Azure Databricks

Często zadawane pytania dotyczące usługi Azure Databricks

  • Umowa SLA usługi Azure Databricks gwarantuje dostępność na poziomie 99,95%.
  • Jednostka Databricks („DBU”) to jednostka oznaczająca możliwości przetwarzania na godzinę rozliczana za użycie na sekundę.
  • Obciążenie Inżynieria danych to zadanie, które powoduje automatyczne rozpoczęcie i zakończenie działania klastra, na którym jest uruchomione. Na przykład obciążenie może zostać wyzwolone przez harmonogram zadań Azure Databricks, który uruchamia klaster Apache Spark wyłącznie na potrzeby zadania i automatycznie kończy działanie klastra po zakończeniu tego zadania.
    Obciążenie Analiza danych nie jest zautomatyzowane. Na przykład polecenia w ramach notesów usługi Azure Databricks są wykonywane w klastrach Apache Spark do momentu ich ręcznego zakończenia. Wielu użytkowników może współużytkować klaster, aby wspólnie wykonywać analizy.

Wszystko gotowe — utwórz bezpłatne konto platformy Azure