탐색 건너뛰기

Azure Databricks

빠르고 쉬우며 공동 작업이 가능한 Apache Spark 기반 분석 서비스

14일 평가판 - 무료 Databricks 단위 포함

개요

빠르고 쉬우며 공동 작업이 가능한 Apache Spark 기반 분석 서비스인 Azure Databricks를 사용하여 빅 데이터 분석 및 AI(인공 지능) 솔루션을 가속화하세요.

몇 분 만에 Spark 환경을 설정하고 빠르고 쉽게 자동 크기 조정하세요. 데이터 과학자, 데이터 엔지니어 및 비즈니스 분석가가 대화형 작업 영역에서 공유 프로젝트에 대해 공동 작업할 수 있습니다. 딥 러닝 프레임워크 및 라이브러리(예: TensorFlow, Pytorch 및 Scikit-learn)뿐만 아니라 Python, Scala, R 및 SQL에 대한 지원으로 기존 기술을 적용하세요. Azure AD(Azure Active Directory) 및 다른 Azure 서비스와의 네이티브 통합을 통해 최신 데이터 웨어하우스 및 기계 학습과 실시간 분석 솔루션을 빌드할 수 있습니다.

Azure Databricks를 사용해야 하는 이유

생산성

몇 분 만에 새로운 Apache Spark 환경을 시작하세요. 대화형 작업 영역에서 다른 Azure 서비스와 원활하게 통합하세요.

확장성

분석 및 기계 학습 프로젝트를 전 세계적으로 확장하세요. 자동으로 크기를 늘리고 줄이는 관리되는 플랫폼으로 비용과 복잡성을 줄이세요.

신뢰성

Azure AD 통합, 역할 기반 제어 및 엔터프라이즈급 SLA로 데이터 및 비즈니스를 보호하세요.

유연성

원하는 언어 및 딥 러닝 프레임워크를 사용하여 기계 학습 및 AI 솔루션을 빌드하세요.

Azure Databricks와 함께 제공되는 기능

최적화된 Apache Spark 환경

관리되는 Apache Spark 환경에서 빠르게 클러스터를 실행하고 빌드하세요. 클러스터는 높은 안정성과 성능을 보장하도록 설정, 구성 및 미세 조정됩니다.

자동 크기 조정 및 자동 종료

요구 사항에 맞게 자동으로 크기를 늘리고 줄여 클러스터 크기의 수동 조정과 관련된 리소스 및 비용을 줄이세요. 비활성 클러스터를 자동 종료하여 리소스를 절약하세요.

공동 작업 작업 영역

대화형 작업 영역을 통해 데이터 엔지니어, 데이터 과학자 및 비즈니스 사용자는 팀으로 공유 프로젝트에 대해 공동 작업하고 댓글을 달 수 있습니다.

딥 러닝에 최적화됨

GPU 지원 클러스터를 사용하여 손쉽게 대규모로 AI 모델을 빌드, 교육 및 배포하세요. 딥 러닝 프레임워크 및 라이브러리(예: TensorFlow, Keras 및 XGBoost)와 함께 미리 설치되고 미리 구성되어 제공되는 기계 학습용 런타임을 사용하세요.

Azure 서비스와 통합

Azure SQL Data Warehouse, Azure Cosmos DB, Azure Data Lake Storage, Azure Event Hubs 및 Azure Data Factory와 같은 다양한 데이터 저장소 및 서비스와 손쉽게 통합하세요. Azure AD를 통해 Single Sign-On을 설정하여 역할 기반 제어를 활용하세요.

여러 언어 및 라이브러리에 대한 지원

Azure Databricks는 Python, Scala, R 및 SQL과 같은 언어를 지원하므로 기존 기술을 사용하여 빌드를 시작할 수 있습니다. SQL, 스트리밍, MLlib 및 GraphX를 비롯한 포괄적인 분석 기술 집합을 사용하여 어떠한 규모의 데이터 또는 프로젝트든 대상으로 할 수 있습니다.

Azure Databricks를 사용한 분석 및 기계 학습

1/6단계

작업 영역 시작

Azure Portal에서 Azure Databricks로 이동합니다. 그런 다음, Azure AD를 통해 Single Sign-On을 사용하여 로그인합니다.

2/6단계

클러스터 실행

새 클러스터를 만들고 원하는 대로 구성한 다음, 한 번의 클릭으로 실행합니다. 자동 크기 조정 기능으로 클러스터 크기를 빠르고 쉽게 조정할 수 있습니다. 수동 크기 조정과 관련된 리소스와 비용을 줄이는 데도 도움이 됩니다.

3/6단계

노트북으로 공동 작업

데이터 엔지니어, 데이터 과학자 및 비즈니스 사용자에 대한 사용자 지정 권한 설정을 만들어 각 기여자가 개별 액세스 수준에서 공유 프로젝트에 대해 라이브로 공동 작업하고 댓글을 달 수 있도록 합니다.

4/6단계

데이터 탐색

노트북은 SQL, Python, Scala 및 R과 같은 대부분의 데이터 언어를 지원합니다. 데이터 엔지니어 및 데이터 과학자는 손쉽게 저장소를 탑재하고 발견 내용을 사용하여 기계 학습 모델을 빌드할 수 있습니다. 비즈니스 사용자는 읽기 쉬운 라이브 데이터 표시에서 데이터를 볼 수 있습니다.

5/6단계

데이터 과학 모델 빌드

원하는 언어를 사용하여 대규모로 AI 모델을 빌드, 교육 및 배포합니다.

6/6단계

작업 예약

단 몇 분 만에 노트북을 작업으로 실행합니다. 기존 스트리밍 또는 기계 학습 라이브러리 중에서 선택합니다. 자동으로 실행할 작업을 미리 예약하고 성능을 모니터링합니다.

Azure Databricks를 사용하여 할 수 있는 작업

최신 데이터 웨어하우스

최신 데이터 웨어하우스를 사용하여 손쉽게 규모와 관계없이 모든 데이터를 모으고 분석 대시보드, 운영 보고서 및 고급 분석을 통해 모든 사용자를 위한 인사이트를 얻을 수 있습니다.

빅 데이터에 대한 고급 분석

최고 수준의 기계 학습 도구를 사용하여 데이터를 실행 가능한 인사이트로 변환합니다. 이 아키텍처를 통해 규모와 관계없이 모든 데이터를 결합하고 사용자 지정 기계 학습 모델을 빌드 및 배포할 수 있습니다.

실시간 분석

편리하게 스트리밍 데이터에서 인사이트를 얻을 수 있습니다. 스트리밍 원본 또는 웹 사이트 클릭 동향의 로그에서 지속적으로 데이터를 캡처하고 거의 실시간으로 처리하세요.

관련 제품 및 서비스

SQL Data Warehouse

엔터프라이즈급 기능을 갖춘 탄력적인 Data warehouse-as-a-Service

Machine Learning Studio

예측 분석 솔루션을 간단히 구축, 배포 및 관리

Azure Cosmos DB

전 세계에 걸쳐 어떤 규모의 사용에도 적합한 다중 모델 데이터베이스

Azure Databricks를 통해 데이터 기반 혁신 가속화