Analiza danych big data oraz sztuczna inteligencja w zoptymalizowanym środowisku Apache Spark
Uzyskuj szczegółowe informacje ze wszystkich swoich danych i twórz rozwiązania sztucznej inteligencji w usłudze Azure Databricks. Skonfiguruj środowisko Apache Spark™ w kilka minut, skaluj je automatycznie i pracuj nad wspólnymi projektami w interaktywnym obszarze roboczym. Usługa Azure Databricks obsługuje języki Python, Scala, R, Java i SQL, a także struktury i biblioteki nauki o danych, takie jak TensorFlow, PyTorch i scikit-learn.
Apache Spark™ to znak towarowy organizacji Apache Software Foundation.
Niezawodna inżynieria danych
Przetwarzaj dane w dużej skali na potrzeby obciążeń wsadowych i przesyłania strumieniowego.
Analiza wszystkich danych
Analizuj najbardziej kompletne i aktualne dane.
Nauka o danych we współpracy z innymi osobami
Uprość i przyspiesz procesy nauki o danych w dużych zestawach danych.
Rozwiązanie oparte na oprogramowaniu typu „open source”
Szybkie, zoptymalizowane środowisko platformy Apache Spark.
Szybko rozpocznij pracę w zoptymalizowanym środowisku Apache Spark
Usługa Azure Databricks udostępnia najnowsze wersje środowiska Apache Spark i umożliwia bezproblemową integrację z bibliotekami typu open source. Uruchamiaj klastry i szybko kompiluj we w pełni zarządzanym środowisku Apache Spark, korzystając z globalnej skali i dostępności platformy Azure. Klastry są instalowane, konfigurowane i dostosowywane tak, aby zapewniały niezawodność i wydajność bez konieczności monitorowania. Wykorzystaj automatyczne skalowanie i kończenie w celu optymalizacji całkowitego kosztu posiadania.
Zwiększ produktywność dzięki współdzielonemu obszarowi roboczemu i popularnym językom
Wydajnie współpracuj na otwartej i ujednoliconej platformie, aby uruchamiać wszystkie typy obciążeń analitycznych niezależnie od tego, czy jesteś badaczem danych, inżynierem danych, czy analitykiem biznesowym. Kompiluj w wybranym języku, na przykład Python, Scala, R, czy SQL. Łatwo uzyskaj kontrolę wersji notesów dzięki serwisowi GitHub i metodologii DevOps.
Usprawnij uczenie maszynowe na podstawie danych big data
Uzyskaj dostęp do zaawansowanych możliwości zautomatyzowanego uczenia maszynowego przy użyciu zintegrowanej usługi Azure Machine Learning w celu szybkiego identyfikowania odpowiednich algorytmów i hiperparametrów. Uprość monitorowanie i aktualizowanie modeli uczenia maszynowego wdrożonych z chmury na urządzenia brzegowe oraz zarządzanie nimi. Usługa Azure Machine Learning zapewnia również centralny rejestr na potrzeby eksperymentów, potoków uczenia maszynowego i modeli.
Uzyskaj nowoczesny magazyn danych o wysokiej wydajności
Łącz dane na dowolną skalę i uzyskuj analizy za pośrednictwem analitycznych pulpitów nawigacyjnych i raportów operacyjnych. Zautomatyzuj przenoszenie danych przy użyciu usługi Azure Data Factory, ładuj dane do usługi Azure Data Lake Storage, przekształcaj je i oczyszczaj w usłudze Azure Databricks, a następnie udostępniaj je do analizy za pomocą usługi Azure Synapse Analytics. Unowocześnij magazyn danych w chmurze, aby osiągnąć niezrównany poziom wydajności i skalowalności.
Najważniejsze możliwości usługi
-
Zoptymalizowany aparat Spark
Korzystaj z prostego przetwarzania danych w automatycznie skalowanej architekturze, obsługiwanej przez wysoce zoptymalizowany aparat Apache Spark™, aby uzyskać nawet 50-krotny wzrost wydajności.
-
Czas wykonywania uczenia maszynowego
Uzyskuj dostęp za pomocą jednego kliknięcia do wstępnie skonfigurowanych środowisk uczenia maszynowego, aby rozszerzyć uczenie maszynowe przy użyciu nowoczesnych i popularnych struktur takich jak PyTorch, TensorFlow czy scikit-learn.
-
MLflow
Śledź i udostępniaj eksperymenty, odtwarzaj przebiegi i wspólnie zarządzaj modelami z poziomu centralnego repozytorium.
-
Wybór języka
Używaj preferowanego języka, na przykład Python, Scala, R, Spark SQL i .Net, niezależnie od tego, czy korzystasz z bezserwerowych, czy aprowizowanych zasobów obliczeniowych.
-
Notesy do współpracy
Szybko uzyskuj dostęp do danych, eksploruj je, uzyskuj i udostępniaj nowe analizy oraz twórz modele we współpracy z innymi osobami, korzystając z wybranych języków i narzędzi.
-
Delta Lake
Zapewnij niezawodność i skalowalność danych w istniejącym magazynie typu data lake, korzystając z transakcyjnej warstwy magazynu typu open source, zaprojektowanej z myślą o całym cyklu życia danych.
-
Natywna integracja z usługami platformy Azure
Uzupełnij swoje kompleksowe rozwiązanie do analizy i uczenia maszynowego dzięki głębokiej integracji z usługami platformy Azure, takimi jak Azure Data Factory, Azure Data Lake Storage, Azure Machine Learning i Power BI.
-
Interaktywne obszary robocze
Umożliwiają bezproblemową współpracę między badaczami danych, inżynierami danych i analitykami biznesowymi.
-
Zabezpieczenia klasy korporacyjnej
Łatwe w użyciu zabezpieczenia natywne chronią dane tam, gdzie się znajdują, tworząc zgodne, prywatne, izolowane obszary robocze analiz obejmujące tysiące użytkowników i zestawów danych.
-
Gotowe do zastosowań produkcyjnych
Bez obaw uruchamiaj i skaluj obciążenia danych o znaczeniu krytycznym na zaufanej platformie danych zintegrowanej z ekosystemem rozwiązań do monitorowania oraz ciągłej integracji/ciągłego wdrażania.
Dowiedz się więcej z przykładów architektury rozwiązań
Nauka o danych i uczenie maszynowe w usłudze Azure Databricks
Łatwo uzyskuj analizy danych przesyłanych strumieniowo na żywo. Przechwytuj ciągle dane z dowolnego urządzenia IoT lub z dzienników ze strumienia kliknięć z witryn internetowych i przetwarzaj je niemal w czasie rzeczywistym.
Nowoczesna architektura analizy przy użyciu usługi Azure Databricks
Przekształcaj dane w szczegółowe informacje wskazujące czynności do wykonania przy użyciu najlepszych w swojej klasie narzędzi do uczenia maszynowego. Ta architektura umożliwia łączenie dowolnych danych w dowolnej skali oraz tworzenie i wdrażanie niestandardowych modeli uczenia maszynowego w dużej skali.
Potoki pozyskiwania, wyodrębniania, transformacji i ładowania oraz przetwarzania strumieniowego z użyciem usługi Azure Databricks
Przyspiesz cały cykl uczenia maszynowego i zarządzaj nim, korzystając z usług Azure Databricks, MLflow i Azure Machine Learning do tworzenia, udostępniania i wdrażania aplikacji uczenia maszynowego oraz do zarządzania nimi.
Wbudowane funkcje kompleksowych zabezpieczeń i zgodności
-
Firma Microsoft inwestuje ponad 1 mld USD rocznie w badania i rozwiązania z zakresu cyberbezpieczeństwa.
-
Zatrudniamy ponad 3500 ekspertów w dziedzinie zabezpieczeń, którzy są skoncentrowani na ochronie danych i prywatności.
-
Platforma Azure ma więcej certyfikatów niż jakikolwiek inny dostawca usług w chmurze. Wyświetl kompleksową listę.
Dowiedz się więcej o produktach i usługach Azure Databricks
Azure Data Factory
Hybrydowa usługa integracji danych upraszczająca wyodrębnianie, przekształcanie i ładowanie na dużą skalę.
Azure Data Lake Storage Gen 2
Wysoce skalowalna i bezpieczna funkcja usługi Data Lake zbudowana na bazie usługi Azure Blob Storage.
Azure Machine Learning
Usługa uczenia maszynowego klasy korporacyjnej umożliwiająca szybsze kompilowanie i wdrażanie modeli.
Power BI
Dodaj możliwości analizy i raportowania interaktywnego do swoich aplikacji.
-
Cennik usługi Azure Databricks
Szybko uruchamiaj klastry i skaluj automatycznie w górę lub w dół według potrzeb. Zapoznaj się ze wszystkimi opcjami cen usługi Azure Databricks.
Zacznij korzystać z bezpłatnego konta platformy Azure
1
2
Po wykorzystaniu środków przejdź na płatność zgodnie z rzeczywistym użyciem, aby kontynuować pracę z użyciem tych samych bezpłatnych usług. Płacisz tylko wtedy, gdy użycie przekroczy bezpłatne miesięczne przydziały.
3
Społeczność i pomoc techniczna platformy Azure
Zadawaj pytania i uzyskuj pomoc od inżynierów firmy Microsoft oraz ekspertów ze społeczności platformy Azure na Forum MSDN i w witrynie Stack Overflow lub skontaktuj się z pomocą techniczną platformy Azure.
Popularne laboratoria i szablony
Odkryj realizowane samodzielnie laboratoria i popularne szablony szybkiego startu dla typowych konfiguracji przygotowane przez firmę Microsoft oraz społeczność.
Zapoznaj się z zasobami dotyczącymi usługi Azure Databricks
Często zadawane pytania dotyczące usługi Azure Databricks
-
Umowa SLA usługi Azure Databricks gwarantuje dostępność na poziomie 99,95%.
-
Jednostka usługi Databricks („DBU”) to jednostka oznaczająca możliwości przetwarzania na godzinę rozliczana za użycie na sekundę.
-
Obciążenie Inżynieria danych to zadanie, które powoduje automatyczne rozpoczęcie i zakończenie działania klastra, na którym jest uruchomione. Na przykład obciążenie może zostać wyzwolone przez harmonogram zadań Azure Databricks, który uruchamia klaster Apache Spark wyłącznie na potrzeby zadania i automatycznie kończy działanie klastra po zakończeniu tego zadania.
Obciążenie Analiza danych nie jest zautomatyzowane. Na przykład polecenia w ramach notesów usługi Azure Databricks są wykonywane w klastrach Apache Spark do momentu ich ręcznego zakończenia. Wielu użytkowników może współużytkować klaster, aby wspólnie wykonywać analizy.