R Server для HDInsight

Прогнозная аналитика, машинное обучение и статистическое моделирование для больших данных

Что такое R Server для HDInsight?

Решение Microsoft R Server для HDInsight позволяет достичь требуемого уровня производительности и масштабируемости за счет использования корпоративного аналитического программного обеспечения для R и реализации всех возможностей Apache Hadoop и Apache Spark. Благодаря многопоточным математическим библиотекам и прозрачному параллелизму R Server вы можете обрабатывать в 1000 раз больше данных в 50 раз быстрее, чем при использовании только языка R с открытым кодом. Таким образом, вы сможете создавать более качественные модели и строить более точные прогнозы. Так как R Server поддерживает язык R с открытым кодом, вам не придется изменять имеющиеся скрипты R.

R Server для HDInsight
  • Крупная портативная библиотека параллельной аналитики и машинного обучения, совместимая с языком R
  • Машинное обучение на терабайтных объемах данных: в 1000 раз больше, чем в R с открытым исходным кодом
  • Обеспечение 50-кратного прироста производительности благодаря R Server для Apache Spark 2.0 и предоставление оптимизированных векторных или математических библиотек
  • Безопасность и поддержка корпоративного уровня в рамках соглашения Майкрософт об уровне обслуживания
  • Доступ к данным Spark с помощью Spark SQL
  • Простая настройка, быстрые результаты

Воспользуйтесь всеми возможностями R

Язык программирования R часто выбирают специалисты по анализу и обработке данных. Глобальное сообщество насчитывает более чем два миллиона пользователей R по всему миру, а количество аналитических пакетов с открытым кодом увеличивается год за годом. Решение R Server для HDInsight обеспечивает полную совместимость с языком R, а также предоставляет широкие возможности масштабирования в Hadoop и Spark.

Все чаще используется язык R. С 2007 по 2013 гг. количество компаний, занимающихся анализом данных, которые используют язык R, выросло с 20 % до 70 %. В 2008 г. доля компаний, использующих язык R в качестве основного инструмента, составляла менее 5 %, а в 2013 г. — уже 24 %.
Количество выпущенных пакетов CRAN за последние несколько лет существенно увеличилось. В 2005 г. их было совсем немного. К 2012 г. число пакетов возросло до 1000, к 2014-му — до 3000, а в 2016 г. их было уже более 8000.

Крупная портативная библиотека параллельной аналитики и машинного обучения, совместимая с языком R

Извлеките преимущества из огромной библиотеки параллельной аналитики и машинного обучения, поддерживающей язык R с открытым кодом и перенос на популярные платформы данных, которая предоставляет возможность работы с деревьями решений, ансамблями, регрессионными моделями и статистическими функциями, а также обеспечивает кластеризацию, подготовку данных и визуализацию.

Машинное обучение на терабайтных объемах данных: обрабатывайте в 1000 раз больше данных

Благодаря прозрачному параллелизму Hadoop и Spark решение R Server для HDInsight позволяет обрабатывать терабайты данных. Это в 1000 раз больше, чем при использовании только языка R с открытым исходным кодом. Обучайте логистические регрессионные модели, деревья и ансамбли на любых объемах данных. Единственное ограничение — размер кластера Spark.

Возможность 50-кратного увеличения производительности

Объединив Apache Spark, многопоточные математические библиотеки для работы с векторами и матрицами и R Server для HDInsight, вы сможете добиться 50-кратного прироста производительности по сравнению с использованием языка R с открытым исходным кодом.

Моделируйте и распределенно обрабатывайте параметры с помощью уже разработанных функций языка R

Запускайте любую функцию R с открытым кодом на сотнях узлов для моделирования и параллельной обработки параметров. Изучайте и улучшайте свои модели, чтобы ускорить и упростить получение более точных прогнозов.

Доступ к данным Spark с помощью Spark SQL

Используйте Apache Spark SQL в качестве источника данных для R Server, чтобы анализировать данные в Hadoop и Spark. Загружайте результаты запроса Spark SQL из таких источников, как Apache Hive и Apache Parquet, в Spark DataFrame и анализируйте их напрямую, используя алгоритмы распределенных вычислений R Server.

Выбор средств разработки

R Server на базе HDInsight включает в себя решение R Studio Server Community Edition, благодаря которому можно быстро приступить к работе. Скачайте бесплатные инструменты R для Visual Studio и получите удобную локальную среду разработки.

Безопасность и поддержка корпоративного уровня

Пользуйтесь средствами обеспечения безопасности корпоративного уровня и услугами поддержки Azure. В частности, вы получаете пакеты версий, исправления, обновления безопасности и инструменты непрерывного мониторинга кластеров. Соглашение Майкрософт об уровне обслуживания кластеров R Server для HDInsight позволяет предотвратить чрезвычайные ситуации и обеспечить возможность подключения на уровне 99,9 %.

Простая настройка, быстрые результаты

R Server для HDInsight не требует длительной установки или настройки. В Azure подготовка к началу работы происходит быстро и без каких-либо усилий с вашей стороны. Вы сможете приступить к работе через несколько минут и получите возможность создавать статистические модели и модели машинного обучения без необходимости приобретать оборудование или оплачивать другие предварительные расходы. Плата взимается только за используемые вычислительные ресурсы и хранилище.

Apache Hadoop® и связанные названия проектов с открытым кодом являются товарными знаками Apache Software Foundation.

Почему R Server для HDInsight является надежным решением?

  • Корпорация Майкрософт ежегодно инвестирует более USD 1 млрд долларов США в научные исследования и разработку решений для обеспечения кибербезопасности.

  • С нами работают более 3,500 экспертов по безопасности, которые полностью посвятили себя обеспечению конфиденциальности и защите ваших данных.

  • У Azure есть больше сертификатов соответствия требованиям, чем у решения любого другого поставщика облачных служб. Просмотрите полный список.

Все необходимое для начала работы

Получите мгновенный доступ и $200 на счет, зарегистрировав бесплатную учетную запись Azure.

Узнайте, как использовать решение "R Server для HDInsight", из пятиминутных кратких руководств и документации.

Расширьте возможности решения "R Server для HDInsight" с помощью дополнительных функций и продуктов, например служб безопасности и резервного копирования.

Опробуйте R Server для HDInsight