R Server для HDInsight

Прогнозная аналитика, машинное обучение и статистическое моделирование для больших данных с использованием R

  • Крупнейшая портативная библиотека параллельной аналитики и машинного обучения, совместимая с языком R
  • Машинное обучение на терабайтных объемах данных: в 1000 раз больше, чем в R с открытым исходным кодом
  • Обеспечение 50-кратного прироста производительности благодаря R Server для Apache Spark 2.0 и предоставление оптимизированных векторных или математических библиотек
  • Безопасность и поддержка корпоративного уровня в рамках соглашения Майкрософт об уровне обслуживания
  • Доступ к данным Spark с помощью Spark SQL
  • Простая настройка, быстрые результаты
R Server для HDInsight

Что такое R Server для HDInsight?

Решение R Server для HDInsight позволяет достичь беспрецедентной производительности и масштабируемости за счет использования корпоративного аналитического программного обеспечения для R и реализации всех возможностей Hadoop и Spark. Благодаря многопоточным математическим библиотекам и прозрачному параллелизму R Server вы можете обрабатывать в 1000 раз больше данных в 50 раз быстрее, чем при использовании только языка R с открытым кодом. Таким образом вы сможете создавать более качественные модели и строить более точные прогнозы. Так как R Server поддерживает язык R с открытым кодом, вам не придется изменять имеющиеся скрипты R.

Воспользуйтесь всеми возможностями R

Язык программирования R часто выбирают специалисты по анализу и обработке данных, и глобальное сообщество из более чем двух миллионов пользователей R по всему миру постоянно растет, а количество аналитических пакетов с открытым исходным кодом экспоненциально увеличивается год за годом. Использование R Server для HDInsight обеспечивает полную совместимость с языком R, а также широкие возможности масштабирования в Hadoop и Spark.

Все чаще используется язык R. С 2007 по 2013 гг. количество компаний, занимающихся анализом данных, которые используют язык R, выросло с 20 % до 70 %. В 2008 г. доля компаний, использующих язык R в качестве основного инструмента, составляла менее 5 %, а в 2013 г. — уже 24 %.
Количество выпущенных пакетов CRAN за последние несколько лет существенно увеличилось. В 2005 г. их было совсем немного. К 2012 г. число пакетов возросло до 1000, к 2014-му — до 3000, а в 2016 г. их было уже более 8000.
Библиотека аналитики R и машинного обучения

Крупнейшая портативная библиотека параллельной аналитики и машинного обучения, совместимая с языком R

Извлеките преимущества библиотеки параллельной аналитики и машинного обучения, поддерживающей язык R с открытым кодом и перенос в популярные платформы данных, которая предоставляет возможность работы с деревьями решений, ансамблями, регрессионными моделями и статистическими функциями, а также обеспечивает кластеризацию, подготовку данных и визуализацию.

Использование терабайтов данных в R Server для HDInsight

Машинное обучение на терабайтных объемах данных: обрабатывайте в 1000 раз больше данных

Благодаря прозрачному параллелизму Hadoop и Spark решение R Server для HDInsight позволяет обрабатывать терабайты данных. Это в 1000 раз больше, чем при использовании только языка R с открытым исходным кодом. Обучайте логистические регрессионные модели, деревья и ансамбли на любых объемах данных. Единственное ограничение — размер кластера Spark.

Высокая производительность R Server для HDInsight

Возможность 50-кратного увеличения производительности

Объединив Apache Spark, многопоточные математические библиотеки для работы с векторами и матрицами и R Server для HDInsight, вы сможете добиться 50-кратного прироста производительности по сравнению с использованием языка R с открытым исходным кодом.

Запуск функций R с открытым кодом

Моделируйте и распределенно обрабатывайте параметры с помощью уже разработанных функций языка R

Запускайте любую функцию R с открытым кодом на сотнях узлов для моделирования и параллельной обработки параметров. Изучайте и улучшайте свои модели, чтобы ускорить и упростить получение более точных прогнозов.

Доступ к данным Spark с помощью Spark SQL

Использование Spark SQL в качестве источника данных для R Server существенно упрощает анализ данных в Hadoop и Spark. Загружайте результаты запроса Spark SQL из таких источников, как Apache Hive и Parquet, в Spark DataFrame и анализируйте их напрямую, используя алгоритмы распределенных вычислений R Server.

Использование собственных средств разработки

R Server на базе HDInsight включает в себя решение R Studio Server Community Edition, благодаря которому специалисты по обработке и анализу данных могут быстро приступить к работе. Вы также можете скачать бесплатные инструменты R Tools для Visual Studio и получить удобную локальную среду разработки.

Средства обеспечения безопасности R Server для HDInsight корпоративного уровня

Безопасность и поддержка корпоративного уровня

Пользуйтесь средствами обеспечения безопасности корпоративного уровня и услугами поддержки Azure. В частности, вы получаете пакеты версий, обновления безопасности и инструменты непрерывного мониторинга кластеров. Кроме того, Azure предлагает соглашение Майкрософт об уровне обслуживания для кластеров R Server для HDInsight, позволяющее предотвратить чрезвычайные ситуации и обеспечить доступность на уровне 99,9 %.

Быстрая настройка без предоплаты

Простая настройка, быстрые результаты

R Server для HDInsight не требует длительной установки или настройки. Azure выполняет все это автоматически. Вы сможете приступить к работе через несколько минут и сможете создавать статистические модели и модели машинного обучения без необходимости приобретать оборудование или оплачивать другие предварительные расходы. Плата взимается только за те вычислительные ресурсы и хранилища, которые вы используете.

Apache Hadoop® и связанные названия проектов с открытым кодом являются товарными знаками Apache Software Foundation.

Опробуйте R Server для HDInsight