Data Lake Analytics

인텔리전스 작업에 힘을 실어주는, 주문형 분석 작업 서비스

페타바이트급 데이터를 대상으로 대규모 병렬 데이터 변환과 처리 프로그램을 U-SQL, R, Python, .Net에서 손쉽게 개발하고 실행할 수 있습니다. 관리할 인프라를 별도로 둘 필요 없이 데이터를 언제든지 처리하고 즉시 확장하여 사용할 수 있고 작업별 비용만 지불하면 됩니다.

수초 내에 시작, 즉시 확장, 각 작업에 사용한 만큼만 비용 지불

Azure Data Lake Analytics로 몇 초만에 빅 데이터 작업을 처리합니다. 기다리거나 관리하거나 조정해야 하는 서버나 가상 컴퓨터, 클러스터가 없기 때문에 인프라를 걱정하지 않아도 됩니다. Azure Data Lake Analytics 단위(AU)로 측정된 처리 능력을 각 작업에 대해 1에서 1,000까지 즉시 확장할 수 있습니다. 비용은 각 작업에서 사용한 처리량만큼만 지불하면 됩니다.

간단하게 대규모 병렬 프로그램 개발

U-SQL은 단순하면서도 표현력이 있고 확장 가능한 언어로, 일단 코드를 작성하면 필요한 규모에 맞게 코드를 자동으로 병렬화할 수 있습니다. .NET 언어나 R, Python으로 작성한 기존 라이브러리를 활용하여 다양한 워크로드 범주(예: 쿼리, ETL, 분석, 기계 학습, 기계 번역, 이미지 처리, 감정 분석)의 페타바이트급 데이터를 처리합니다. 기본 제공되는 U-SQL 인지 라이브러리로 백만 개 이미지에서 개체 형식을 검색하는 방식은 U-SQL query execution for Azure Data Lake(Azure Data Lake에 대한 U-SQL 쿼리 실행) 비디오에서 확인하세요.

빅 데이터 프로그램을 간편하게 디버그하고 최적화

클라우드 배포 프로그램에서 오류를 디버깅하는 작업은 사용자 개인 환경에서 프로그램을 디버깅하는 작업만큼 쉽습니다. 프로그램이 실행되면 Microsoft의 실행 환경에서 프로그램을 활발히 분석하여 성능은 높이고 비용은 줄일 수 있는 다양한 사항을 권장해 줍니다. 예를 들어 프로그램에 1000AU를 요청했지만 50AU만 필요하다면 50AU만 사용하도록 시스템에서 권장하기 때문에 비용을 95% 줄일 수 있습니다.

분석 가상화

관계형 소스(예: Azure SQL Database, Azure SQL Data Warehouse) 데이터를 최적으로 가상화하므로 모든 데이터를 처리할 수 있습니다. 또한 데이터를 옮기지 않고 처리 위치를 소스 데이터 근처로 옮겨 쿼리를 자동으로 최적화하므로 성능은 최대화되고 대기 시간은 최소화할 수 있습니다.

엔터프라이즈급 보안, 감사 및 지원

온-프레미스 보안과 거버넌스 통제를 클라우드로 확장하고 보안 요건과 규제 준수 요건을 충족합니다. Azure Active Directory를 통해 SSO(Single Sign-On), 다단계 인증 및 수백만 개 ID의 원활한 관리 기능이 기본 제공됩니다. 또한 역할 기반 액세스 제어 기능과 처리 및 관리 작업을 모두 감사할 수 있는 기능도 기본으로 제공됩니다. 빅 데이터 솔루션에 대해 99.9%의 엔터프라이즈급 SLA를 보증하고 24/7 지원을 약속합니다.

관련 제품 및 서비스

데이터 레이크 저장소

빅 데이터 분석 작업을 위한 대규모 저장소

HDInsight

클라우드 Hadoop, Spark, R Server, HBase 및 Storm 클러스터 프로비전

무료로 Data Lake Analytics 사용해 보기