Azure Databricks

빠르고 쉬우며 협업이 가능한 Apache SparkTM 기반 분석 서비스

최적화된 Apache Spark를 사용하는 빅 데이터 분석 및 AI

모든 데이터에서 얻은 인사이트를 활용하고 Azure Databricks를 통해 AI(인공 지능) 솔루션을 빌드하고, Apache Spark™ 환경을 몇 분 만에 설정하고, 자동으로 크기 조정하고, 대화형 작업 영역의 공유 프로젝트에서 협업하세요. Azure Databricks는 Python, Scala, R, Java 및 SQL뿐 아니라 TensorFlow, PyTorch, scikit-learn 등을 비롯한 데이터 과학 프레임워크와 라이브러리도 지원합니다.

Apache Spark™는 Apache Software Foundation의 상표입니다.

안정적인 데이터 엔지니어링

일괄 처리 및 스트리밍 워크로드를 위한 대규모 데이터 처리

모든 데이터의 분석

가장 완벽한 최신 데이터에 분석 사용

협업이 가능한 데이터 과학

대규모 데이터 세트에 대해 데이터 과학 간소화 및 가속화

오픈 소스에 기반을 둠

빠르고 최적화된 Apache Spark 환경

최적화된 Apache Spark 환경으로 빠르게 시작

Azure Databricks는 최신 버전의 Apache Spark를 제공하며 오픈 소스 라이브러리와 원활하게 통합할 수 있습니다. Azure의 글로벌 규모와 가용성을 지원하는 완전 관리형 Apache Spark 환경에서 빠르게 클러스터를 실행하고 빌드하세요. 클러스터는 모니터링 없이도 안정성과 성능을 보장하도록 설정, 구성 및 미세 조정됩니다. 자동 크기 조정과 자동 종료를 활용하여 TCO(총 소유 비용)를 절감하세요.

Azure Databricks 설명서 읽기

공유 작업 영역과 공용 언어로 생산성 향상

데이터 과학자, 데이터 엔지니어, 비즈니스 분석가 등 누구나 개방형 통합 플랫폼에서 효과적으로 협업하여 모든 유형의 분석 워크로드를 실행할 수 있습니다. Python, Scala, R, SQL 등 원하는 언어로 빌드하세요. GitHub 및 Azure DevOps를 활용하여 Notebook 버전을 쉽게 제어하세요.

Azure Databricks 작업 영역을 만드는 방법 알아보기

빅 데이터 기반의 기계 학습 강화

통합 Azure Machine Learning을 사용하여 적절한 알고리즘과 하이퍼 매개 변수를 빠르게 파악하는 자동화된 Machine Learning 고급 기능에 액세스하세요. 클라우드에서 에지에 배포된 기계 학습 모델의 관리, 모니터링 및 업데이트를 간소화하세요. 또한 Azure Machine Learning은 실험, 기계 학습 파이프라인 및 모델을 위한 중앙 레지스트리도 제공합니다.

Azure Databricks 및 Azure Machine Learning에 관한 웨비나 보기

고성능 최신 데이터 웨어하우징 활용

규모와 관계없이 데이터를 결합하고 분석 대시보드 및 운영 보고서를 통해 인사이트를 얻으세요. Azure Data Factory를 사용하여 데이터 이동을 자동화한 다음, 데이터를 Azure Data Lake Storage로 로드하고 Azure Databricks를 사용하여 데이터를 변환 및 정리한 후 Azure Synapse Analytics를 사용하여 분석에 사용할 수 있도록 만드세요. 클라우드에서 데이터 웨어하우스를 현대화하여 최고 수준의 성능과 확장성을 얻으세요.

Azure의 클라우드 규모 분석에 대해 알아보기

주요 서비스 기능

최적화된 Spark 엔진

최대 50배 성능 향상을 위해 높은 수준으로 최적화된 Apache Spark™에서 제공하는 자동 스케일링 인프라에서 간단한 데이터 처리 기능이 제공됩니다.

기계 학습 런타임

PyTorch, TensorFlow, scikit-learn 등의 첨단 인기 프레임워크를 사용하여 증강 기계 학습을 위한 미리 구성된 기계 학습 환경에 한 번 클릭으로 액세스하세요.

MLflow

중앙 리포지토리에서 실험을 추적하고 공유하며, 실행을 재현하고, 모델을 협업 방식으로 관리하세요.

언어 선택

서버리스 컴퓨팅 리소스를 사용하든 또는 프로비저닝된 컴퓨팅 리소스를 사용하든 관계없이 Python, Scala, R, Spark SQL, .Net 등 원하는 언어를 사용하세요.

협업이 가능한 Notebook

데이터에 빠르게 액세스하여 데이터를 탐색하고, 새 인사이트를 찾아 공유하고, 원하는 언어와 도구를 사용하여 협업으로 모델을 빌드합니다.

Delta Lake

전체 데이터 수명 주기에 맞게 설계된 오픈 소스 트랜잭션 스토리지 계층을 사용하여 기존 데이터 레이크에 데이터 안정성 및 확장성을 가져오세요.

Azure 서비스와의 네이티브 통합

Azure Data Factory, Azure Data Lake Storage, Azure Machine Learning 및 Power BI 같은 Azure 서비스와의 긴밀한 통합으로 엔드투엔드 분석 및 기계 학습 솔루션을 완성하세요.

대화형 작업 영역

데이터 과학자, 데이터 엔지니어 및 비즈니스 분석가 간에 원활한 협업을 수행할 수 있습니다.

엔터프라이즈급 보안

간편한 기본 보안은 데이터가 있는 위치에서 데이터를 보호하고 수천 명의 사용자와 수천 개의 데이터 세트에 대해 규정을 준수하는 격리된 프라이빗 분석 작업 영역을 만듭니다.

프로덕션 준비

CI/CD 및 모니터링을 위한 에코시스템 통합을 통해 신뢰할 수 있는 데이터 플랫폼에서 안심하고 가장 중요한 업무용 데이터 워크로드를 실행하고 스케일링하세요.

솔루션 아키텍처 예에서 자세히 알아보기

빅 데이터 아키텍처에 대한 실시간 분석

편리하게 라이브 스트리밍 데이터에서 인사이트를 얻을 수 있습니다. IoT 디바이스 또는 웹 사이트 클릭 동향의 로그에서 지속적으로 데이터를 캡처하고 거의 실시간으로 처리합니다.

고급 분석 아키텍처

최고 수준의 기계 학습 도구를 사용하여 데이터를 실행 가능한 인사이트로 변환합니다. 이 아키텍처를 통해 규모에 관계없이 모든 데이터를 결합하고 사용자 지정 머신 러닝 모델을 대규모로 구축하고 배포할 수 있습니다.

기계 학습 수명 주기 관리

Azure Databricks, MLflow 및 Azure Machine Learning을 사용하여 기계 학습 애플리케이션을 빌드, 공유, 배포 및 관리함으로써 엔드투엔드 기계 학습 수명 주기를 가속화하고 관리하세요.

협상 불가능한 데이터 보안 및 개인 정보 보호

  • 업계 최고의 다양한 보안 및 규정 준수 기능을 사용하여 데이터 및 분석 솔루션을 보호, 모니터링 및 관리하세요.

  • Single Sign-On 및 Azure Active Directory 통합을 사용하여 데이터 전문가가 인사이트를 얻는 데 더 많은 시간을 사용할 수 있도록 지원하세요.

  • Azure는 다른 어떤 클라우드 공급 기업보다 많은 인증을 취득했습니다. 전체 목록을 확인하세요.

Azure Databricks 제품 및 서비스에 대한 자세한 정보

Azure Databricks 가격 책정

여러 업계의 회사에서 신뢰함

클라우드 기반 딥 러닝을 활용하여 안전을 위협하는 요소 파악

Shell은 Azure, AI, 머신 비전을 활용하여 고객과 직원을 더 효과적으로 보호합니다.

Shell

성능 향상과 비용 절감 확대

데이터 서비스 renewablesAI는 Azure 및 Apache Spark를 사용하여 수익성과 안정성을 갖춘 태양 에너지 시장을 구축하도록 지원합니다.

Renewables AI

Azure에서 엔드투엔드 분석 솔루션을 사용하도록 설정

물류 공급 기업인 LINX Cargo Care Group은 Azure Databricks를 사용하여 전사적 혁신 활동을 전개합니다.

LINX Cargo Care Group

Azure Databricks 시작

Azure 체험 계정에 등록하여 즉시 액세스 권한을 받으세요.

Azure Databricks 사용 방법을 자세히 알아보려면 설명서를 읽으세요.

클러스터, Notebook, 테이블 등을 만들려면 빠른 시작을 살펴보세요.

커뮤니티 및 Azure 지원

MSDN 포럼 및 Stack Overflow에서 Microsoft 엔지니어와 Azure 커뮤니티 전문가에게 질문하고 지원을 받거나 Azure 지원 팀에 문의하세요.

많이 사용되는 랩 및 템플릿

Microsoft와 커뮤니티에서 제공하는 자가 학습 랩 및 많이 사용되는 일반 구성용 빠른 시작 템플릿을 찾아 보세요.

최신 Azure Databricks 뉴스 및 리소스 받기

Databricks 업데이트, 블로그 및 알림

Azure Databricks에 대해 자주 묻는 질문

  • Azure Databricks SLA는 99.95% 가용성을 보장합니다.
  • DBU(Databricks 단위)는 시간당 처리 능력의 단위이며, 초당 사용량을 기준으로 요금이 청구됩니다.
  • 데이터 엔지니어링 워크로드는 워크로드가 실행되는 클러스터를 자동으로 시작하고 종료하는 작업입니다. 예를 들어 워크로드는 작업 전용의 Apache Spark 클러스터를 시작하고 작업이 완료된 후 자동으로 클러스터를 종료하는 Azure Databricks 작업 스케줄러에 의해 트리거될 수 있습니다.
    데이터 분석 워크로드는 자동화되지 않습니다. 예를 들어 Azure Databricks Notebook의 명령은 수동으로 종료하기 전까지 Apache Spark 클러스터에서 실행됩니다. 여러 사용자가 클러스터를 공유하여 공동으로 분석할 수 있습니다.

준비가 되셨다면 Azure 체험 계정을 설정해 볼까요?