빅 데이터 분석용 Data Lake Storage

개요

고성능 분석을 위한 기반 구축

단일 스토리지 플랫폼을 사용하여 데이터 사일로를 제거합니다. 계층화된 스토리지 및 정책 관리를 통해 비용을 최적화합니다. Microsoft Entra ID(이전 Azure Active Directory) 및 RBAC(역할 기반 액세스 제어)를 사용하여 데이터를 인증합니다. 또한 미사용 암호화 및 고급 위협 방지와 같은 보안 기능으로 데이터를 보호합니다.

Azure 글로벌 인프라를 사용하여 모든 용량의 요구 사항을 충족하고 데이터를 손쉽게 관리합니다. 일관된 고성능으로 대규모 분석 쿼리를 실행합니다.
암호화, 데이터 액세스 및 네트워크 수준 제어를 포괄하는 기능으로 데이터 레이크를 보호하며, 모두 인사이트를 더욱더 안전하게 이끌도록 설계됩니다.
광범위한 데이터 수집 도구를 사용하여 대규모로 데이터를 수집합니다. Azure Databricks, Azure Synapse Analytics 또는 Azure HDInsight를 사용하여 데이터를 처리합니다. 또한 혁신적인 인사이트를 얻을 수 있도록 Microsoft Power BI를 사용하여 데이터 시각화합니다.
스토리지와 컴퓨팅을 독립적으로 스케일링하여 비용을 최적화합니다. 온-프레미스 데이터 레이크에서는 불가능한 일입니다. 사용량에 따라 계층 수준을 조절하고 자동화된 수명 주기 관리 정책을 활용하여 스토리지 비용을 최적화합니다.

기능

주요 스토리지 플랫폼 기능

보안

보안 및 규정 준수 포함

34,000

Microsoft에서 보안 이니셔티브에 전념하는 상근 엔지니어 수입니다.

15,000

특수 보안 전문성을 갖춘 파트너 수입니다.

>100

전 세계 지역 및 국가에 맞는 50개 이상의 규정 준수 인증이 있습니다.

Azure의 보안에 대한 자세한 정보

가격 책정

데이터 레이크 빌드를 위한 유연한 가격

계층, 예약, 수명 주기 관리 등에서 가격 옵션을 선택합니다.

자세한 정보

고객 사례

모든 규모의 기업이 신뢰하는 제품

"이제 Azure와 함께하며 데이터에서 신속하게 가치를 이끌어낼 수 있습니다. 우리가 만드는 데이터 모델에서 획득한 실행 가능한 인사이트는 수익을 늘리고 비용을 절감하며 위험을 최소화해 줍니다."

Ahmed Adnani, Smiths Group의 애플리케이션 및 분석 담당 이사

"며칠 동안 작업을 실행하기 위해 대규모 클러스터가 필요할 때 Microsoft Azure는 큰 도움이 됩니다. 그런 다음 절약을 위해 클러스터 제거할 수 있습니다. 반면 데이터 센터는 거의 완전히 실행할 수 없습니다. Azure는 판도를 크게 바꾸어 놓았습니다."

James Ferguson, Marks & Spencer의 제품 매니저

리소스

개발자 리소스

Azure Data Lake Storage 개요

Azure Data Lake Storage Gen2 소개와 빅 데이터 분석을 위한 주요 기능을 이해해 보세요.

자세한 정보

데이터에 대한 액세스 제어

Azure Data Lake Storage Gen2에서 액세스 제어가 어떻게 작동하는지, 권한 모델과 보안 옵션에 대해 알아보세요.

자세한 정보

Azure Data Lake Storage 모범 사례

Azure Data Lake Storage Gen2를 사용해 성능, 보안, 비용을 최적화하는 모범 사례를 살펴보세요.

자세한 정보

FAQ

BLOB 위에 계층 구조 네임스페이스를 추가하면 빅 데이터 분석 프레임워크가 설계된 파일 시스템 인터페이스를 손상하지 않고 클라우드 스토리지의 비용 이점을 유지할 수 있습니다.

간단한 예로 분석 작업에서 자주 발생하는 한 패턴으로, 출력 데이터를 임시 디렉터리에 쓴 후 커밋 단계에서 해당 디렉터리의 이름을 최종 이름으로 바꾸는 작업을 들 수 있습니다. 개체 저장소(의도적으로 디렉터리 표기법을 지원하지 않음)에서 이러한 이름 바꾸기는 N번의 복사 및 삭제가 필요한 작업으로 시간이 오래 걸릴 수 있습니다. 여기서 N은 디렉터리의 파일 수입니다. 계층 구조 네임스페이스를 사용하는 경우 이 디렉터리 조작 작업은 원자성이 되어 성능 및 비용이 개선됩니다. 또한 디렉터리를 파일 시스템의 요소로 지원하면 부모 디렉터리를 사용하는 POSIX 규격 ACL(액세스 제어 목록)을 적용하여 권한을 전파할 수 있습니다.
다른 클라우드 저장소 서비스와 마찬가지로, Data Lake Storage는 저장한 데이터의 양과 해당 데이터에서 수행한 작업의 비용에 따라 요금이 청구됩니다. 비용 분석을 확인하세요.
Data Lake Storage는 주로 Hadoop 및 Hadoop FileSystem을 데이터 액세스 계층으로 사용하는 모든 프레임워크(예: Spark 및 Presto)에서 작동하도록 설계되었습니다. 세부 정보를 참조하세요.

Azure에서 Data Lake Storage는 다음과 상호 운용할 수 있습니다.

Azure Data Factory
Azure HDInsight
Azure Databricks
Azure Synapse Analytics
Power BI
이 서비스는 Azure Blob Storage 에코시스템에도 포함되어 있습니다.
Data Lake Storage는 데이터 액세스를 제어하기 위한 여러 메커니즘을 제공합니다. 계층 구조 네임스페이스를 제공하는 이 서비스는 HDFS(Hadoop 분산 파일 시스템) 사용 권한의 기반이 되는 POSIX 규격 ACL(액세스 제어 목록)을 제공하는 유일한 클라우드 분석 저장소입니다. 또한 Data Lake Storage는 스토리지 방화벽, 프라이빗 엔드포인트, TLS 1.2 적용 및 시스템 또는 고객이 제공한 키를 사용한 미사용 암호화를 통해 지원하는 전송 수준의 보안 기능을 포함합니다.