HDInsight

Управляемая служба аналитики больших данных с открытым исходным кодом для предприятий

Azure HDInsight — это управляемая служба аналитики больших данных с открытым исходным кодом для предприятий. Для Hadoop, Spark, Hive, HBase, Storm, Kafka и Microsoft R Server можно создать оптимизированные кластеры, гарантирующие непрерывную работу в течение 99,9 % времени.

Управляемое аналитическое решение с открытым исходным кодом и ведущее в отрасли соглашение об уровне обслуживания

В то время как другие предоставляют соглашения об уровне обслуживания для базовых виртуальных машин, HDInsight является единственной службой в отрасли, предоставляющей полное соглашение об уровне обслуживания для рабочей нагрузки. Для Hadoop, Spark, Hive, HBase, Storm, Kafka и Microsoft R Server можно создать оптимизированные кластеры, гарантирующие непрерывную работу в течение 99,9 % времени. С помощью этих составных элементов можно выполнить сценарии, которые охватывают ETL, хранение данных, обработку и анализ данных, Интернет вещей и потоковую передачу, оптимизируя инвестиции в локальной среде. С помощью HDInsight можно запускать готовые к работе решения, обеспечивая при этом безопасность и мониторинг корпоративного уровня за минуты в Azure.

HDInsight работает с такими проектами Hadoop, как Apache HBase, Apache Storm, Apache Hive, Apache Spark и Apache Kafka

Глобальный доступ

Доступна в более чем 25 регионах по всему миру — больше, чем любое другое предложение аналитики больших данных. Доступна также в облаке Azure для государственных организаций и Китае.

Безопасность и соответствие нормативам

HDInsight обеспечивает защиту ресурсов данных и расширяет локальные средства обеспечения безопасности и контроля до облачного уровня. В этом решении предусмотрены такие возможности, как единый вход, многофакторная идентификация и простое управление миллионами удостоверений в Azure Active Directory. Благодаря Apache Ranger вы можете выполнять авторизацию пользователей и групп, используя политики точного управления доступом, которые распространяются на все корпоративные данные. HDInsight соответствует требованиям акта о передаче и защите данных учреждений здравоохранения (HIPAA), стандартам безопасности данных в сфере платежных карт (PCI) и требованиям контроля обслуживающих организаций (SOC), поэтому вы можете быть уверены, что ваши корпоративные данные всегда надежно защищены. HDInsight обеспечивает самый высокий уровень непрерывности бизнес-процессов, так как обладает расширенными функциями работы с оповещениями, мониторинга и определения упреждающих действий, а также отличается улучшенной защитой рабочих нагрузок благодаря встроенной возможности интеграции с набором мониторинга Azure.

Высокопроизводительная платформа для разработчиков и специалистов по обработке и анализу данных

Используйте многофункциональные наборы решений, повышающих эффективность работы, для Hadoop и Spark в предпочитаемой среде разработки, такой как Visual Studio, Eclipse или IntelliJ, чтобы обеспечить поддержку Scala, Python, R, Java и .NET. Благодаря интеграции с двумя самыми популярными веб-приложениями Notebook, Jupyter и Zeppelin, специалисты по обработке и анализу данных могут объединять код, статистические уравнения и визуализацию, чтобы представить свои данные. Кроме того, HDInsight — это единственное управляемое облачное решение Hadoop, которое можно интегрировать с Microsoft R Server. Благодаря многопоточным математическим библиотекам и прозрачному параллелизму R Server вы можете обрабатывать в 1000 раз больше данных в 50 раз быстрее, чем при использовании только языка R с открытым кодом. Таким образом, вы сможете создавать более качественные модели и строить более точные прогнозы, чем раньше.

Экономичная облачная масштабируемость

Увеличивайте и уменьшайте масштаб рабочих нагрузок без лишних затрат благодаря разделению хранилища и вычислительных ресурсов. Локальное хранилище можно использовать для кэширования и повышения производительности операций ввода-вывода. Пользователи Spark и Interactive Hive могут использовать твердотельные накопители, чтобы увеличить производительность интерактивных решений, а пользователи Kafka могут хранить все данные потоковой передачи на управляемых дисках уровня "Премиум". Выберите тип виртуальной машины Azure, обеспечивающий самое эффективное потребление ресурсов, и платите только за используемые вычислительные ресурсы и хранилище.

Наиболее расширяемая платформа

Партнеры HDInsight вместе с ведущими независимыми поставщиками программного обеспечения предоставляют быструю, удобную для использования и расширяемую платформу приложений.

При развертывании кластера можно развернуть независимые поставщики программного обеспечения (такие как Cask, Streamsets, H20.AI и т. д.) для расширения возможностей платформ аналитики Hadoop, Spark и Kafka.

Что можно создать с помощью Azure HDInsight?

Ниже приведены примеры использования.

"Интернет вещей" и приложения потоковой передачи

Служба для автомобиля Toyota с сетевыми возможностями, Office 365, Bing Ads обрабатывают миллионы событий в секунду при обработке больших данных в реальном времени в HDInsight через Kafka, Storm и Spark Streaming.

Дополнительные сведения

Обработка и анализ данных и машинное обучение

Преобразуйте свой бизнес, добавив интеллектуальный анализ в свои приложения и организацию.

Дополнительные сведения

Хранение данных

Выполняйте интерактивный запрос с объемом в несколько петабайтов к структурированным или неструктурированным данным в любом формате, создавайте модели, подключившись к знакомому средству разработки BI.

Дополнительные сведения

Гибридная среда с Azure HDInsight и локальной средой

Расширьте свои локальные инвестиции на облако и преобразуйте свой бизнес с помощью расширенной аналитики и предложений BI в облаке.

Дополнительные сведения

Клиенты, расширяющие возможности аналитики больших данных с помощью Azure HDInsight

Схема обучения HDInsight