HDInsight

기업을 위한 관리되는 오픈 소스 빅 데이터 분석 서비스

Azure HDInsight는 기업을 위한 관리되는 오픈 소스 빅 데이터 분석 서비스입니다. 99.9% SLA를 지원하는 Hadoop, Spark, Hive, HBase, Storm, Kafka, Microsoft R Server에 대해 최적화된 클러스터를 만들 수 있습니다.

업계 선도적인 SLA를 통한 관리되는 오픈 소스 분석 서비스

경쟁업체들이 기본 VM에 SLA를 제공하는 것과 달리, HDInsight는 워크로드에 완벽한 SLA를 지원하는 업계 유일 서비스입니다. 99.9% SLA를 지원하는 Hadoop, Spark, Hive, HBase, Storm, Kafka, Microsoft R Server에 대해 최적화된 클러스터를 만들어보세요. 이러한 구성 요소를 사용하면 ETL, 웨어하우징, 데이터 과학, IoT, 스트리밍을 포함하면서 온-프레미스 투자를 확장하는 시나리오를 완성할 수 있습니다. HDInsight를 사용하면 Azure에서 몇 분 내에 기업 수준의 보안 및 모니터링 기능을 갖춘, 프로덕션에서 사용할 준비가 된 솔루션으로서 이러한 것들을 실행할 수 있습니다.

HDInsight는 Apache HBase, Apache Storm, Apache Hive, Apache Spark, Apache Kafka 등의 Hadoop 프로젝트에서 작동합니다.

글로벌 접근

다른 모든 빅 데이터 분석 제품들보다 많은, 전 세계 25개 이상 지역에서 사용할 수 있습니다. 또한 Azure Government 클라우드 및 중국에서도 사용할 수 있습니다.

보안 및 규정 준수

HDInsight를 사용하여 데이터 자산을 보호하고 온-프레미스 보안과 거버넌스(governance) 통제를 클라우드로 옮겨와 강화할 수 있습니다. 또한 HDInsight에서는 Azure Active Directory를 통해 SSO(Single Sign-On)와 Multi-Factor Authentication을 이용할 수 있고 수백만 개 ID도 원활히 관리할 수 있습니다. Apache Ranger를 통해서는 전체 엔터프라이즈 데이터에 대한 액세스를 세부적으로 제어할 수 있는 정책 권한을 사용자와 그룹에게 부여할 수 있습니다. HDInsight는 HIPAA(Health Insurance Portability and Accountability Act), PCI(Payment Card Industry) 및 SOC(Service Organization Controls) 규정을 준수하므로 엔터프라이즈 데이터 자산을 항상 보호된 상태로 유지하는 데 도움이 됩니다. 또한 최고 수준의 비즈니스 연속성을 확보할 수 있도록 하기 위해 선점형 작업에 대한 정의/모니터링/경고 설정 기능을 확대했을 뿐 아니라 Azure의 모니터링 도구 모음과 네이티브 통합되었기 때문에 워크로드를 한층 더 강력하게 보호합니다.

개발자와 과학자를 위한 고생산성 플랫폼

Visual Studio, Eclipse, IntelliJ 같은 선호하는 개발 환경에서 생산성이 뛰어난 Hadoop용/Spark용 제품군을 사용하여 Scala, Python, R, Java, .NET을 지원할 수 있습니다. 데이터 과학자는 코드와 통계 수식, 시각화를 통합할 수 있기 때문에 널리 사용되는 두 Notebook JupyterZeppelin에 통합하여 데이터에 대한 의견을 내놓을 수 있습니다. 또한 HDInsight는 Microsoft R Server에 통합되는 유일한 관리형 클라우드 Hadoop 솔루션입니다. R Server에는 다중 스레드 수학 라이브러리 및 투명 병렬화가 있으므로 오픈 소스 R보다 1000배 많은 데이터를 최대 50배 더 빠르게 처리할 수 있습니다. 따라서 더 정확한 모델을 학습시켜 예측 성능을 기존보다 훨씬 높일 수 있습니다.

비용 효율적인 클라우드 규모

계산과 저장소를 분리했기 때문에 워크로드를 비용 효율적으로 늘리거나 줄일 수 있습니다. 당연히 로컬 저장소도 캐싱과 고속 I/O에 사용할 수 있습니다. Spark 사용자와 대화형 Hive 사용자는 SSD 메모리를 사용하여 대화형 성능을 높일 수 있고 Kafka 사용자는 모든 스트리밍 데이터를 프리미엄 관리 디스크에 보관할 수 있습니다. 그 어떤 유형의 Azure 가상 컴퓨터도 리소스 사용률을 최적화하니 원하는 유형을 선택하여 사용하고 사용한 계산과 저장소에 대한 비용만 지불하세요.

가장 확장성이 좋은 플랫폼

HDInsight는 주요 ISV와 파트너 관계를 맺어 한 번의 클릭으로 사용하기 쉽고 확장 가능한 앱 프레임워크를 제공합니다.

클러스터를 배포하는 동안 Hadoop, Spark, Kafka 분석 플랫폼의 기능 확장을 위해 Cask, Streamsets, H20.AI 등과 같은 ISV가 배포될 수 있습니다.

Azure HDInsight로 무엇을 빌드할 수 있을까요?

아래 사용 사례에 대해 알아보세요.

사물 인터넷 + 스트리밍 응용 프로그램

Toyota의 커넥티드 카, Office 365, Bing 광고는 Kafka, Storm, Spark Streaming을 통한 HDInsight에서의 실시간 빅 데이터 처리를 위해 1초에 수백만 개의 이벤트를 처리합니다.

자세한 정보

데이터 과학 + Machine Learning

응용 프로그램과 조직에 인텔리전스를 더하여 비즈니스를 혁신하세요.

자세한 정보

데이터 웨어하우징

모든 형식의 구조화 또는 구조화되지 않은 데이터에 대해 대화형 쿼리를 페타바이트 크기로 수행하고, 선호하는 BI 도구로 연결하면서 모델을 빌드하세요.

자세한 정보

Azure HDInsight의 하이브리드 전환 + 온-프레미스

온-프레미스 투자를 클라우드로 확장하고, 클라우드에서 고급 분석과 BI 제품을 활용하여 비즈니스를 혁신하세요.

자세한 정보

Azure HDInsight를 통해 빅 데이터 분석을 강화한 고객

HDInsight 학습 경로