HDInsight용 R 서버

빅 데이터를 위한 예측 분석, 기계 학습 및 통계 모델링

HDInsight용 R 서버

HDInsight용 R 서버란?

HDInsight용 Microsoft R Server는 엔터프라이즈급 R 분석 소프트웨어와 Apache Hadoop과 Apache Spark의 강력한 기능을 통합했기 때문에 필요한 규모와 성능을 제공합니다. R Server에는 다중 스레드 수학 라이브러리 및 투명 병렬화가 있으므로 오픈 소스 R보다 1000배 많은 데이터를 최대 50배 더 빠르게 처리할 수 있습니다. 따라서 더 정확한 모델을 학습시켜 예측 성능을 높일 수 있습니다. R Server는 오픈 소스 R 언어와 함께 작동하므로 모든 R 스크립트를 변경 없이 실행할 수 있습니다.

R의 기능 및 친숙함으로 작업

데이터 과학자가 선택한 최고의 프로그래밍 언어로써, R 프로그래밍 언어에는 전 세계 2백만 명 이상의 사용자로 이루어진 글로벌 커뮤니티가 있으며 전체 오픈 소스 분석 패키지 수는 해마다 기하급수적으로 늘어나고 있습니다. HDInsight용 R Server를 사용하면 Hadoop 및 Spark에서 대규모로 실행되는 R 언어와 완벽하게 호환됩니다.

R 사용량이 점점 증가하고 있습니다. 2007년과 2013년 사이에 R 사용을 보고하는 데이터 마이너 수는 20%에서 70%로 증가했습니다. 2008년과 2013년 사이에 R을 기본 도구로 사용하는 데이터 마이너 수는 5%에서 24%로 증가했습니다.
릴리스된 CRAN 패키지 수가 최근 몇 년 동안 상당히 늘었습니다. 2005년에는 별로 없었습니다. 2012년에는 릴리스 수가 1000으로 증가하고, 2014년에는 3000, 2016년에는 8000 이상으로 늘었습니다.
R 분석 및 기계 학습 라이브러리

이식 가능한 대규모 R 병렬 분석 및 기계 학습 라이브러리

대규모 병렬 분석과 기계 학습 라이브러리를 사용할 수 있습니다. 이 라이브러리는 기본적으로 오픈 소스 R 언어와 호환하고 널리 사용되는 데이터 플랫폼에서 이식 가능합니다. 또한 의사 결정 트리와 앙상블, 회귀 모델, 클러스터링, 데이터 준비, 시각화, 통계 함수 등을 지원합니다.

HDInsight용 R 서버로 테라바이트의 데이터 사용

1,000배 더 많은 데이터를 처리하는 테라바이트급 기계 학습

HDInsight용 R Server는 Hadoop 및 Spark를 기반으로 하는 투명한 병렬 처리를 통해 오픈 소스 R 언어를 단독으로 사용할 때보다 1,000배 더 많은 테라바이트의 데이터를 처리할 수 있습니다. 양에 상관 없이 모든 데이터에서 로지스틱 회귀 모델, 트리 및 앙상블을 교육합니다. Spark 클러스터의 크기에만 제한될 뿐입니다.

HDInsight용 R 서버를 사용하여 성능 향상

최대 50배 더 빠른 성능

Spark, 멀티스레드 벡터와 매트릭스 수학 라이브러리, HDInsight용 R Server와 통합하여 기존 오픈 소스 R보다 최대 50배 더 빠른 성능을 경험할 수 있습니다.

오픈 소스 R 함수 실행

기존 R 함수로 분산 매개 변수 스윕 및 시뮬레이션 실행

병렬 매개 변수 스윕 및 시뮬레이션을 위해 수백 개의 노드에 대해 모든 오픈 소스 R 함수를 실행합니다. 모델을 세부적으로 살피고 조정함으로써 쉽고 빠르고 정확하게 예측할 수 있습니다.

Spark SQL을 통해 Spark 데이터 소스에 액세스

Apache Spark SQL을 R Server용 데이터 원본으로 사용하여 Hadoop과 Spark에서 데이터를 분석할 수 있습니다. Apache Hive 및 Apache Parquet 같은 소스에 대한 Spark SQL 쿼리 결과를 Spark Data Frame에 로드한 후 R Server 분산 컴퓨팅 알고리즘으로 바로 분석하면 됩니다.

개발 도구 선택

HDInsight의 R Server에는 쉽고 빠르게 시작할 수 있는 R Studio Server Community Edition이 포함되어 있습니다. Visual Studio용 R 도구를 무료로 다운로드하여 편리한 로컬 개발 환경을 만들 수 있습니다.

HDInsight용 R 서버를 보호하는 엔터프라이즈급 보안

엔터프라이즈급 보안 및 지원

버전 패키지, 패치, 보안 업데이트 및 지속적인 클러스터 모니터링을 포함한 Azure의 엔터프라이즈급 보안 및 지원을 활용하세요. Microsoft SLA(서비스 수준 약정)에서 99.9%의 연결을 제공하기 때문에 HDInsight 클러스터용 R Server를 재난으로부터 보호할 수 있습니다.

빠른 설정 및 사전 투자 비용 없음

쉬운 설정, 빠른 결과

HDInsight용 R 서버는 시간이 많이 걸리는 설치 또는 설정 작업이 필요하지 않습니다. Azure가 대신 처리해드립니다. 몇 분 안에 설치하고 실행할 수 있으며, 새 하드웨어를 구입하거나 기타 사전 투자 비용을 들이지 않고 통계 및 기계 학습 모델을 교육할 수 있습니다. 사용하는 계산 및 저장소에 대해서만 비용이 청구됩니다.

Apache Hadoop® 및 관련 오픈 소스 프로젝트 이름은 Apache Software Foundation의 상표입니다.

HDInsight용 R Server 사용해 보기