HDInsight

기업을 위한 클라우드 Spark 서비스와 Hadoop 서비스

Azure HDInsight는 유일한 완전 관리형 클라우드 Apache Hadoop 솔루션으로, Spark, Hive, MapReduce, HBase, Storm, Kafka, Microsoft R Server에 최적화된 오픈 소스 기반의 분석 클러스터를 제공하고 99.9% SLA를 보장합니다. 이러한 빅 데이터 기술과 ISV 응용 프로그램은 엔터프라이즈급 보안과 모니터링으로 관리 클러스터 형태로 배포 가능합니다.

오픈 소스 기반의 안정된 분석과 업계 선도적인 SLA 보장

99.9% SLA와 24/7 지원으로 엔터프라이즈급 오픈 소스 클러스터 유형을 강화하세요. Microsoft SLA는 가상 컴퓨터 인스턴스뿐만 아니라 Azure 빅 데이터 솔루션 전체의 작동을 보장합니다. HDInsight는 헤드 노드 복제, 데이터 지역 복제, 기본 대기 NameNode 같은 기능으로 전체 중복성과 고가용성을 확보하도록 설계되었기 때문에 표준 Hadoop 구현에서 처리하지 못하는 중요한 오류가 발생해도 빠르게 작동을 복원합니다. 또한 Azure는 클러스터 모니터링과 24/7 엔터프라이즈급 지원 서비스도 제공합니다. 이러한 서비스는 다른 관리형 클라우드 공급업체를 모두 합한 수보다 많은 37명에 달하는 Hadoop Core 커미터가 관련된 Microsoft와 Hortonworks의 협업으로 뒷받침됩니다. 이에 따라 배포 환경에서 코드를 수정하고 Hadoop에 다시 커밋할 수 있습니다.

HDInsight는 Apache HBase, Apache Storm, Apache Hive, Apache Spark, Apache Kafka 등의 Hadoop 프로젝트에서 작동합니다.
HDInsight는 HIPAA, PCI, SOC, DSS, ISO의 규정을 준수합니다.

엔터프라이즈급 보안 및 모니터링

HDInsight를 사용하여 데이터 자산을 보호하고 온-프레미스 보안과 거버넌스(governance) 통제를 클라우드로 옮겨와 강화할 수 있습니다. 또한 HDInsight에서는 Azure Active Directory를 통해 SSO(Single Sign-On)와 Multi-Factor Authentication을 이용할 수 있고 수백만 개 ID도 원활히 관리할 수 있습니다. Apache Ranger를 통해서는 전체 엔터프라이즈 데이터에 대한 액세스를 세부적으로 제어할 수 있는 정책 권한을 사용자와 그룹에게 부여할 수 있습니다. HDInsight는 HIPAA(Health Insurance Portability and Accountability Act), PCI(Payment Card Industry) 및 SOC(Service Organization Controls) 규정을 준수하므로 엔터프라이즈 데이터 자산을 항상 보호된 상태로 유지하는 데 도움이 됩니다. 또한 최고 수준의 비즈니스 연속성을 확보할 수 있도록 하기 위해 선점형 작업에 대한 정의/모니터링/경고 설정 기능을 확대했을 뿐 아니라 Microsoft Operations Management Suite과 네이티브 통합되었기 때문에 워크로드를 한층 더 강력하게 보호합니다.

개발자와 과학자를 위한 고생산성 플랫폼

Visual Studio, Eclipse, IntelliJ 같은 선호하는 개발 환경에서 생산성이 뛰어난 Hadoop용/Spark용 제품군을 사용하여 Scala, Python, R, Java, .NET을 지원할 수 있습니다. 데이터 과학자는 코드와 통계 수식, 시각화를 통합할 수 있기 때문에 널리 사용되는 두 Notebook JupyterZeppelin에 통합하여 데이터에 대한 의견을 내놓을 수 있습니다. 또한 HDInsight는 Microsoft R Server에 통합되는 유일한 관리형 클라우드 Hadoop 솔루션입니다. R Server에는 다중 스레드 수학 라이브러리 및 투명 병렬화가 있으므로 오픈 소스 R보다 1000배 많은 데이터를 최대 50배 더 빠르게 처리할 수 있습니다. 따라서 더 정확한 모델을 학습시켜 예측 성능을 기존보다 훨씬 높일 수 있습니다.

비용 효율적인 클라우드 규모

계산과 저장소를 분리했기 때문에 워크로드를 비용 효율적으로 늘리거나 줄일 수 있습니다. 당연히 로컬 저장소도 캐싱과 고속 I/O에 사용할 수 있습니다. Spark 사용자와 대화형 Hive 사용자는 SSD 메모리를 사용하여 대화형 성능을 높일 수 있고 Kafka 사용자는 모든 스트리밍 데이터를 프리미엄 관리 디스크에 보관할 수 있습니다. 그 어떤 유형의 Azure 가상 컴퓨터도 리소스 사용률을 최적화하니 원하는 유형을 선택하여 사용하고 사용한 계산과 저장소에 대한 비용만 지불하세요.

업계 선도적인 생산성 응용 프로그램과 통합

ISV(Independent Software Vendor) 시장이 번성함에 따라, 광범위한 Hadoop 에코시스템 전반에 걸쳐 다양한 부가 가치 솔루션이 공급되고 있습니다. HDInsight에서는 모든 클러스터를 에지 노드와 스크립트 작업으로 확장할 수 있기 때문에, Hadoop 클러스터와 Spark 클러스터를 Datameer, Cask, AtScale, StreamSets 같은 어떤 ISV 응용 프로그램과도 사전에 즉시 통합하거나 미리 조정하여 실행할 수 있습니다.)

관리자가 손쉽게 관리

새 하드웨어를 구입할 필요나 기타 사전 투자 비용 없이 클라우드에 Hadoop을 배포하세요. 첫 번째 클러스터를 몇 분 내에 실행할 수 있습니다. 시간이 많이 걸리는 설치 또는 설정 작업을 할 필요가 없으며 운영 체제를 패치하거나 Hadoop 버전을 업그레이드할 필요도 없습니다. Azure가 대신 처리해 줍니다.

Apache Hadoop® 및 관련 오픈 소스 프로젝트 이름은 Apache Software Foundation의 상표입니다.

Azure에서 Hadoop 클러스터를 구축한 고객

빅 데이터 에코시스템용으로 작성된 응용 프로그램 찾기 및 배포

Azure Marketplace에서 신뢰할 수 있는 Hadoop 파트너의 인기 있는 응용 프로그램을 찾아서 배포하세요.

무료로 HDInsight 클러스터 사용해 보기