R Server для HDInsight

Прогнозная аналитика, машинное обучение и статистическое моделирование для больших данных

R Server для HDInsight

Что такое R Server для HDInsight?

Решение Microsoft R Server для HDInsight позволяет достичь требуемого уровня производительности и масштабируемости за счет использования корпоративного аналитического программного обеспечения для R и реализации всех возможностей Apache Hadoop и Apache Spark. Благодаря многопоточным математическим библиотекам и прозрачному параллелизму R Server вы можете обрабатывать в 1000 раз больше данных в 50 раз быстрее, чем при использовании только языка R с открытым кодом. Таким образом, вы сможете создавать более качественные модели и строить более точные прогнозы. Так как R Server поддерживает язык R с открытым кодом, вам не придется изменять имеющиеся скрипты R.

Воспользуйтесь всеми возможностями R

Язык программирования R часто выбирают специалисты по анализу и обработке данных. Глобальное сообщество насчитывает более чем два миллиона пользователей R по всему миру, а количество аналитических пакетов с открытым кодом увеличивается год за годом. Решение R Server для HDInsight обеспечивает полную совместимость с языком R, а также предоставляет широкие возможности масштабирования в Hadoop и Spark.

Все чаще используется язык R. С 2007 по 2013 гг. количество компаний, занимающихся анализом данных, которые используют язык R, выросло с 20 % до 70 %. В 2008 г. доля компаний, использующих язык R в качестве основного инструмента, составляла менее 5 %, а в 2013 г. — уже 24 %.
Количество выпущенных пакетов CRAN за последние несколько лет существенно увеличилось. В 2005 г. их было совсем немного. К 2012 г. число пакетов возросло до 1000, к 2014-му — до 3000, а в 2016 г. их было уже более 8000.
Библиотека аналитики R и машинного обучения

Крупная портативная библиотека параллельной аналитики и машинного обучения, совместимая с языком R

Извлеките преимущества из огромной библиотеки параллельной аналитики и машинного обучения, поддерживающей язык R с открытым кодом и перенос на популярные платформы данных, которая предоставляет возможность работы с деревьями решений, ансамблями, регрессионными моделями и статистическими функциями, а также обеспечивает кластеризацию, подготовку данных и визуализацию.

Использование терабайтов данных в R Server для HDInsight

Машинное обучение на терабайтных объемах данных: обрабатывайте в 1000 раз больше данных

Благодаря прозрачному параллелизму Hadoop и Spark решение R Server для HDInsight позволяет обрабатывать терабайты данных. Это в 1000 раз больше, чем при использовании только языка R с открытым исходным кодом. Обучайте логистические регрессионные модели, деревья и ансамбли на любых объемах данных. Единственное ограничение — размер кластера Spark.

Высокая производительность R Server для HDInsight

Возможность 50-кратного увеличения производительности

Объединив Apache Spark, многопоточные математические библиотеки для работы с векторами и матрицами и R Server для HDInsight, вы сможете добиться 50-кратного прироста производительности по сравнению с использованием языка R с открытым исходным кодом.

Запуск функций R с открытым кодом

Моделируйте и распределенно обрабатывайте параметры с помощью уже разработанных функций языка R

Запускайте любую функцию R с открытым кодом на сотнях узлов для моделирования и параллельной обработки параметров. Изучайте и улучшайте свои модели, чтобы ускорить и упростить получение более точных прогнозов.

Доступ к данным Spark с помощью Spark SQL

Используйте Apache Spark SQL в качестве источника данных для R Server, чтобы анализировать данные в Hadoop и Spark. Загружайте результаты запроса Spark SQL из таких источников, как Apache Hive и Apache Parquet, в Spark DataFrame и анализируйте их напрямую, используя алгоритмы распределенных вычислений R Server.

Выбор средств разработки

R Server на базе HDInsight включает в себя решение R Studio Server Community Edition, благодаря которому можно быстро приступить к работе. Скачайте бесплатные инструменты R для Visual Studio и получите удобную локальную среду разработки.

Средства обеспечения безопасности R Server для HDInsight корпоративного уровня

Безопасность и поддержка корпоративного уровня

Пользуйтесь средствами обеспечения безопасности корпоративного уровня и услугами поддержки Azure. В частности, вы получаете пакеты версий, исправления, обновления безопасности и инструменты непрерывного мониторинга кластеров. Соглашение Майкрософт об уровне обслуживания кластеров R Server для HDInsight позволяет предотвратить чрезвычайные ситуации и обеспечить возможность подключения на уровне 99,9 %.

Быстрая настройка без предоплаты

Простая настройка, быстрые результаты

R Server для HDInsight не требует длительной установки или настройки. В Azure подготовка к началу работы происходит быстро и без каких-либо усилий с вашей стороны. Вы сможете приступить к работе через несколько минут и получите возможность создавать статистические модели и модели машинного обучения без необходимости приобретать оборудование или оплачивать другие предварительные расходы. Плата взимается только за используемые вычислительные ресурсы и хранилище.

Apache Hadoop® и связанные названия проектов с открытым кодом являются товарными знаками Apache Software Foundation.

Опробуйте R Server для HDInsight