Pomiń nawigację

Azure Databricks

Szybka i łatwa w obsłudze usługa analityczna do pracy zespołowej oparta na platformie Apache Spark

14-dniowa wersja próbna — obejmuje bezpłatne jednostki Databricks

Przegląd

Usługa Azure Databricks to szybka i łatwa w użyciu usługa analityczna do pracy zespołowej oparta na oprogramowaniu Apache Spark, która pozwala przyspieszyć działanie rozwiązań do analizy danych big data.

Umożliwia ona skonfigurowanie środowiska platformy Spark w ciągu kilku minut oraz szybkie i łatwe autoskalowanie. Analitycy danych, inżynierowie danych i analitycy biznesowi mogą wspólnie pracować nad udostępnionymi projektami w interakcyjnym obszarze roboczym. Możesz korzystać z dotychczasowych umiejętności dzięki obsłudze środowisk Python, Scala, R i SQL oraz platform i bibliotek uczenia głębokiego, takich jak TensorFlow, Pytorch i Scikit-learn. Natywna integracja z usługą Azure Active Directory (Azure AD) i innymi usługami platformy Azure umożliwia tworzenie magazynu danych oraz rozwiązań do uczenia maszynowego i analizy w czasie rzeczywistym.

Dlaczego warto korzystać z usługi Azure Databricks?

Produktywne

Uruchom nowe środowisko platformy Apache Spark w ciągu kilku minut. Bezproblemowa integracja z innymi usługami platformy Azure w interakcyjnym obszarze roboczym.

Skalowalność

Skaluj globalnie swoje projekty analityczne i projekty uczenia maszynowego. Zmniejsz koszt i złożoność przy użyciu platformy zarządzanej, która umożliwia autoskalowanie w górę i w dół.

Zaufane

Chroń swoje dane i firmę poprzez integrację z usługą Azure AD, kontrole oparte na rolach i umowy SLA klasy korporacyjnej.

Elastyczność

Twórz rozwiązania uczenia maszynowego i sztucznej inteligencji przy użyciu dowolnego języka i dowolnych platform uczenia głębokiego.

Co zawiera usługa Azure Databricks?

Zoptymalizowane środowisko platformy Apache Spark

Możesz szybko uruchamiać klastry i tworzyć zawartość w zarządzanym środowisku platformy Apache Spark. Klastry są zainstalowane, skonfigurowane i dostosowane tak, aby zapewniały wysoką niezawodność i wydajność.

Autoskalowanie i automatyczne kończenie działania

Zmniejsz liczbę zasobów i koszty związane z ręcznym skalowaniem klastrów przez autoskalowanie w górę i w dół zgodnie z wymaganiami. Możesz automatycznie kończyć działanie nieaktywnych klastrów w celu zaoszczędzenia zasobów.

Obszar roboczy współpracy

Interakcyjny obszar roboczy umożliwia inżynierom danych, analitykom danych i użytkownikom biznesowym współpracę nad udostępnionymi projektami i dodawanie do nich komentarzy jako zespół.

Optymalizacja pod kątem uczenia głębokiego

Łatwo twórz, trenuj i wdrażaj modele sztucznej inteligencji w skali przy użyciu klastrów z obsługą procesora GPU. Korzystaj z preinstalowanego środowiska uruchomieniowego uczenia maszynowego ze wstępnie skonfigurowanymi bibliotekami i platformami uczenia głębokiego, takimi jak TensorFlow, Keras i XGBoost.

Integracja z usługami platformy Azure

Bez wysiłku przeprowadzaj integrację z różnych magazynami danych i usługami, takimi jak Azure SQL Data Warehouse, Azure Cosmos DB, Azure Data Lake Storage, Azure Event Hubs i Azure Data Factory. Włącz logowanie jednokrotne za pomocą usługi Azure AD, aby odblokować kontrole oparte na rolach.

Obsługa wielu języków i bibliotek

Usługa Azure Databricks obsługuje takie języki jak Python, Scala, R i SQL, dzięki czemu można zacząć tworzyć zawartość, korzystając z posiadanych już umiejętności. Pracuj z danymi w dowolnej ilości lub projektami o dowolnych rozmiarach, korzystając z pełnego zestawu technologii analitycznych, w tym SQL, Streaming, MLlib i GraphX.

Analiza i uczenie maszynowe w usłudze Azure Databricks

Krok 1 z 6

Uruchamianie obszaru roboczego

Przejdź do usługi Azure Databricks w witrynie Azure Portal. Następnie zaloguj się przy użyciu logowania jednokrotnego w usłudze Azure AD.

Krok 2 z 6

Uruchamianie klastrów

Utwórz nowy klaster, skonfiguruj go odpowiednio i uruchom go jednym kliknięciem. Funkcja autoskalowania przyspiesza i ułatwia skalowanie klastrów. Umożliwia również zmniejszenie zasobów i kosztów związanych z ręcznym skalowaniem.

Krok 3 z 6

Współpraca przy użyciu notesów

Utwórz niestandardowe ustawienia uprawnień dla inżynierów danych, analityków danych i użytkowników biznesowych, aby każdy współautor mógł współpracować na żywo i dodawać komentarze do udostępnionych projektów zgodnie z indywidualnym poziomem dostępu.

Krok 4 z 6

Eksplorowanie danych

Notesy obsługują większość języków danych, takich jak SQL, Python, Scala i R. Inżynierowie danych i analitycy danych mogą łatwo instalować magazyn danych oraz używać wyników do tworzenia modeli uczenia maszynowego. Użytkownicy biznesowi mogą wyświetlać dane w łatwych do odczytania widoków danych na żywo.

Krok 5 z 6

Tworzenie modeli nauki o danych

Twórz, trenuj i wdrażaj modele sztucznej inteligencji w skali przy użyciu dowolnego języka.

Krok 6 z 6

Planowanie zadań

Uruchamianie notesów jako zadań zajmuje tylko kilka minut. Wybierz istniejącą bibliotekę przesyłania strumieniowego lub bibliotekę uczenia maszynowego. Planuj zadania z wyprzedzeniem, uruchamiaj je automatycznie i monitoruj ich wydajność.

Do czego służy usługa Azure Databricks

Nowoczesny magazyn danych

Nowoczesny magazyn danych umożliwia łatwe łączenie wszystkich typów danych o dowolnej skali oraz udostępnia wszystkim użytkownikom szczegółowe informacje za pomocą analitycznych pulpitów nawigacyjnych, raportów operacyjnych i analizy zaawansowanej.

Zaawansowana analiza danych big data

Przekształcaj dane w szczegółowe informacje wskazujące czynności do wykonania przy użyciu najlepszych w swojej klasie narzędzi do uczenia maszynowego. Ta architektura umożliwia łączenie dowolnych danych w dowolnej skali oraz tworzenie i wdrażanie niestandardowych modeli uczenia maszynowego.

Analiza w czasie rzeczywistym

Łatwo uzyskuj szczegółowe informacje z danych przesyłanych strumieniowo. Przechwytuj ciągle dane z dowolnego źródła przesyłania strumieniowego lub z dzienników ze strumienia kliknięć z witryn internetowych i przetwarzaj je niemal w czasie rzeczywistym.

Powiązane produkty i usługi

SQL Data Warehouse

Elastyczny magazyn danych jako usługa oferująca funkcje klasy korporacyjnej

Machine Learning Studio

Łatwe tworzenie i wdrażanie rozwiązań do analiz predykcyjnych oraz zarządzanie nimi

Azure Cosmos DB

Globalnie dystrybuowana, wielomodelowa usługa bazy danych dla każdej skali

Przyspieszaj innowacje bazujące na danych z użyciem usługi Azure Databricks