Пропустить навигацию

Служба хранилища Azure Data Lake

Служба хранилища Data Lake с высокой степенью масштабируемости

Azure Data Lake Storage Gen2 является экономичным решением Data Lake с высокой масштабируемостью для аналитики больших данных. Оно сочетает в себе мощь высокопроизводительной файловой системы массивного масштабирования и экономии, что помогает сократить время анализа данных. Data Lake Storage Gen2 расширяет возможности хранилища BLOB-объектов Azure и является оптимизированным для рабочих нагрузок аналитики. Единожды сохранив данные, вы получаете к ним доступ через существующие совместимые с хранилищем BLOB-объектов и распределенной файловой системой Hadoop (HDFS) интерфейсы файловой системы без копирования данных или каких-либо изменений в программе. Data Lake Storage Gen2 является самым полным из существующих Data Lake.

Какие преимущества у службы хранилища Data Lake?

Продуктивность

Тестирование моделей происходит быстрее с помощью совместимой файловой системы Hadoop, в которой поддерживается работа с атомарными файлами и папками, и которая является оптимизированной для выполнения заданий с молниеносной скоростью.

Надежность

Файловая система Data Lake создана для соответствия наиболее строгим корпоративным требованиям безопасности данных. Она поддерживает высококачественную ACL-поддержку, совместимую с POSIX, защиту хранилища объектов с помощью шифрования при хранении, интеграцию с Azure Active Directory и брандмауэры учетных записей.

Масштабируемость

Обеспечьте глобальный масштаб, долговечность и производительность хранилища BLOB-объектов Azure, включая поддержку массовых учетных записей хранения.

Экономичность

Получите функциональность Data Lake соответственно уровням цен на хранение облачных объектов. Чтобы оптимизировать затраты на хранение данных без их копирования между службами, Data Lake Storage Gen2 использует функции управления жизненным циклом и функциональные возможности уровня объекта, встроенные в хранилище BLOB-объектов Azure.

Возможности службы хранилища Data Lake

Быстрое создание продвинутых аналитических рабочих процессов

Чтобы создать сквозные большие данные и расширенные аналитические решения Data Lake Storage Gen2 интегрируется с другими службами данных Azure, включая Azure Databricks и фабрику данных Azure.

Выполняйте задания быстрее и более эффективно

Рабочие нагрузки аналитики больших данных могут повлечь за собой значительную плату за транзакции во время выполнения задания, например, когда файлы и папки создаются, переименовываются или удаляются. Data Lake Storage Gen2 поддерживает операции с атомарными файлами, что значительно сокращает плату за транзакции, необходимые для выполнения задания, и время, необходимое для завершения задач аналитики больших данных.

Реализация аналитической деятельности в глобальном масштабе

Data Lake Storage Gen2 соответствует требованиям регионального управления данными. После выхода общедоступной версии служба Data Lake Storage Gen2 будет доступна во всех регионах Azure.

Используйте Azure Data Lake Storage 2-го поколения с решениями от этих доверенных партнеров

  • Striim
  • Attunity
  • Informatica Cloud
  • WANDisco

Какие сферы использования службы хранилища Data Lake?

Современное хранилище данных

Расширенная аналитика с использованием больших данных

Аналитика в режиме реального времени

Связанные продукты и услуги

Azure Databricks

Быстрая и простая платформа аналитики на основе Apache Spark с возможностью совместного использования

Фабрика данных

Простая гибридная интеграция данных в масштабах предприятия

HDInsight

Подготовка облачных кластеров Hadoop, Spark, R Server, HBase и Storm