데이터 레이크 저장소

지능형 작업에 힘을 실어주는, 크기 제한 없는 Data Lake

데이터 크기 제한이 없는 최초의 기업용 클라우드 Data Lake를 사용하여 데이터가 비정형 데이터든 반정형 데이터든 정형 데이터든 상관없이 데이터의 가치를 끌어낼 수 있습니다. Azure Data Lake Store는 안전하고 대규모로 확장 가능하며 개방형 HDFS 표준에 따라 구축했기 때문에 대규모 병렬 분석을 실행할 수 있습니다.

페타바이트급 파일과 방대한 규모의 개체 저장

조직은 Azure Data Lake Store를 사용하여 어떤 인위적인 제약 없이 한 곳에서 모든 데이터를 분석할 수 있습니다. Data Lake Store에서 저장할 수 있는 파일 개수는 방대하며, 저장 가능한 단일 파일 크기는 1페타바이트 이상으로 다른 클라우드 저장소보다 200배 더 큽니다. 이 때문에 Data Lake Store는 고해상도 동영상, 게놈/지진 데이터 집합, 의료 데이터 등 다양한 업계에서 사용하는 어떤 형식의 데이터라도 완벽하게 저장합니다.

대규모 병렬 분석을 실행하도록 처리량 확장 가능

Data Lake Store는 응용 프로그램을 재구성하거나 데이터를 더 높은 배율로 파티셔닝하지 않고 처리량 규모를 확대/축소하기 때문에 사실상 모든 규모의 분석 워크로드를 지원합니다. 또한 수백 테라바이트급 데이터를 효율적으로 읽고 쓰는 동시 실행기를 수천 개 탑재하고 있어 분석 작업을 실행하는 처리량이 월등히 뛰어납니다.

늘 암호화 유지, 역할 기반의 보안 및 감사

Data Lake Store는 데이터 자산을 보호하고 온-프레미스 보안과 거버넌스(governance) 통제를 클라우드로 쉽게 확장해 줍니다. 데이터는 늘 암호화되는데, 동적 데이터는 SSL을 사용하여 암호화되고 정적 데이터는 Azure Key Vault의 서비스나 사용자 관리형 HSM 백업 키를 사용하여 암호화됩니다. SSO(Single Sign-On)와 Multi-Factor Authentication을 제공하는 것은 물론, 수백만 개 ID를 원활하게 관리할 수 있는 기능이 Azure Active Directory를 통해 기본으로 제공됩니다. Store에 저장된 모든 데이터에 대해 POSIX 기반으로 세부 조정된 ACL로 사용자와 그룹에 권한을 부여할 수 있으므로 역할 기반 액세스 제어가 가능합니다. 마지막으로 모든 액세스나 시스템 구성 변경을 감사하기 때문에 보안 요건과 규정 준수 요건을 충족할 수 있습니다.

클라우드를 위한 HDFS

Microsoft Azure Data Lake Store는 개방형 Apache HDFS(Hadoop Distributed File System) 표준을 채택한 모든 응용 프로그램을 지원합니다. 또한 HDFS를 지원하기 때문에 HDFS 디렉터리 구조를 다시 작성하지 않고도 기존 Hadoop 데이터와 Spark 데이터를 클라우드로 간편하게 마이그레이션할 수 있습니다.


Apache Hadoop® 및 관련 오픈 소스 프로젝트 이름은 Apache Software Foundation의 상표입니다.

엔터프라이즈급 지원

빅 데이터 솔루션에 대해 99.9%의 엔터프라이즈급 SLA를 보증하고 24/7 지원을 약속합니다.

관련 제품 및 서비스

Data Lake Analytics

빅 데이터 사용을 용이하게 하는 분산 분석 서비스

HDInsight

클라우드 Hadoop, Spark, R Server, HBase 및 Storm 클러스터 프로비전

Data Lake Store 사용해 보기