Azure Data Lake Storage
Безопасное хранилище с высоким уровнем масштабируемости для рабочих нагрузок аналитики, требующих высокой производительности.
Создание основы для высокой производительности аналитики
Избавьтесь от необходимости использовать приемники данных благодаря единой платформе хранения. Оптимизируйте затраты с помощью многоуровневого хранилища и управления на основе политик. Проверяйте подлинность при доступе к данным с помощью Azure Active Directory (Azure AD) и управления доступом на основе ролей (RBAC). Защищайте данные благодаря таким функциям обеспечения безопасности, как шифрование неактивных данных и расширенная защита от угроз.
Неограниченное масштабирование и устойчивость данных на уровне 99,99999999999999 % с автоматической георепликацией
Хранилище с высоким уровнем безопасности с гибкими механизмами защиты доступа к данным, шифрования и управления на уровне сети
Единая платформа хранилища для приема, обработки и визуализации, которая поддерживает наиболее популярные платформы аналитики
Оптимизация затрат благодаря независимому масштабированию хранилища и вычислений, управление жизненным циклом на основе политик и распределение по уровням на уровне объектов
Масштабирование, позволяющее выполнять самые ресурсоемкие рабочие нагрузки аналитики
Удовлетворяйте любые требования к емкости и с легкостью управляйте данными с помощью глобальной инфраструктуры Azure. Выполняйте крупномасштабные аналитические запросы со стабильно высокой производительностью.
Использование гибких механизмов безопасности
Защитите свое озеро данных с помощью различных возможностей — от шифрования до доступа к данным и контроля на уровне сети, — которые в совокупности обеспечивают более безопасную аналитику.
Формирование масштабируемой основы для аналитики
Принимайте данные в большом масштабе, используя широкий спектр инструментов приема данных. Обрабатывайте данные с помощью Azure Databricks, Azure Synapse Analytics или Azure HDInsight. Визуализируйте данные с помощью Microsoft Power BI, получая качественно новые аналитические сведения.
Создавайте экономичные облачные озера данных
Оптимизируйте затраты за счет отдельного масштабирования хранилища и вычислений, что невозможно при работе с локальными озерами данных. Повышайте или понижайте уровень в зависимости от объема использования и применяйте политики автоматического управления жизненным циклом для оптимизации затрат на хранение.
Комплексные встроенные средства обеспечения безопасности и соответствия требованиям
-
Корпорация Майкрософт ежегодно инвестирует более 1 млрд USD (долларов США) в исследования и разработку решений для кибербезопасности.
-
У нас работает более 3500 специалистов по безопасности, которые посвятили себя защите данных и обеспечению их конфиденциальности.
-
У Azure больше сертификатов, чем у любого другого поставщика облачных служб. Ознакомьтесь с полным списком.
-
Гибкие цены на создание озер данных
Выберите подходящий вам вариант цены в зависимости от распределения по уровням, резервирования и управления жизненным циклом.
Начните работу с бесплатной учетной записью Azure
1
2
Чтобы продолжать работу с этими службами, когда кредит будет израсходован, перейдите на оплату по мере использования. Плата будет взиматься только при использовании служб сверх предоставляемого бесплатно ежемесячного объема.
3
Нам доверяют компании всех размеров
"Благодаря Azure у нас теперь есть возможность быстро повысить ценность наших данных. Аналитические сведения для принятия решения на основе создаваемых нами моделей данных помогут нам увеличить доходы, снизить затраты и минимизировать риски."
Ахмед Аднани (Ahmed Adnani), директор по приложениям и аналитике, Smiths Group
"Microsoft Azure нам очень помогает, когда нам нужны огромные кластеры на пару дней для выполнения работы, а затем позволяет вернуть их в целях экономии, в то время как центр обработки данных практически не предоставляет такой гибкости. Это значительно повлияло на наши процессы."
Джеймс Фергюсон (James Ferguson), менеджер по продуктам, Marks & Spencer
"При работе в Azure мы располагаем возможностями по улучшению скорости, диапазона, точности и локализации наших прогнозов — вопрос лишь в том, чему отдать предпочтение в первую очередь."
Брэд Бичлер, старший научный сотрудник по машинному обучению, AccuWeather
Ресурсы для разработчиков
Практические руководства
Часто задаваемые вопросы о Data Lake Storage
-
Добавление иерархического пространства имен поверх больших двоичных объектов позволяет сохранить экономические преимущества облачного хранилища без ущерба для интерфейсов файловой системы, для которых были разработаны платформы аналитики больших данных.
Простой пример — часто встречающийся шаблон задания аналитики, в котором выходные данные записываются во временный каталог, а затем, на этапе фиксации, этот каталог переименовывается, получая окончательное имя. В хранилище объектов (которое по определению не поддерживает понятие каталогов) такие переименования могут быть длительными операциями, включающими N операций копирования и удаления, где N — число файлов в каталоге. В иерархическом пространстве имен такие операции с каталогами являются атомарными, что повышает производительность и снижает стоимость. Кроме того, вспомогательные каталоги как элементы файловой системы позволяют применять совместимые с POSIX списки управления доступом (ACL), в которых используются родительские каталоги для распространения разрешений.
-
Как и в случае с другими службами облачного хранения, плата за Data Lake Storage зависит от объема хранимых данных и стоимости операций, выполняемых с этими данными. См. разбивку затрат.
-
Хранилище Data Lake Storage в первую очередь предназначено для работы с Hadoop и всеми платформами, использующими файловую систему Hadoop в качестве уровня доступа к данным (например, Spark и Presto). Подробнее.
В Azure хранилище Data Lake Storage совместимо с:
- Фабрика данных Azure
- Azure HDInsight
- Azure Databricks
- Azure Synapse Analytics
- Power BI
Эта служба также включена в экосистему хранилища BLOB-объектов Azure.
-
Data Lake Storage предоставляет несколько механизмов для управления доступом к данным. Предоставляя иерархическое пространство имен, эта служба является единственным облачным хранилищем аналитики, в котором применяются совместимые с POSIX списки управления доступом (ACL), формирующие базу для разрешений распределенной файловой системы Hadoop (HDFS). Data Lake Storage также включает возможности обеспечения безопасности на транспортном уровне с помощью брандмауэров хранилища, частных конечных точек, принудительного применения TLS 1.2 и шифрования неактивных данных с использованием системных или клиентских ключей.