Azure Databricks

Быстрая и простая служба аналитики на основе Apache SparkTM для совместной работы

Аналитика больших данных и ИИ с использованием оптимизированного проекта Apache Spark

Получайте аналитические сведения на основе всех своих данных и создавайте решения с использованием искусственного интеллекта (ИИ) при помощи Azure Databricks, настройте среду Apache Spark™ за считанные минуты, обеспечьте автомасштабирование и участвуйте в совместной работе над общими проектами в интерактивной рабочей области. Azure Databricks поддерживает Python, Scala, R, Java и SQL, а также библиотеки и платформы обработки и анализа данных, включая TensorFlow, PyTorch и scikit-learn.

Apache Spark™ является товарным знаком компании Apache Software Foundation.

Надежный инжиниринг данных

Крупномасштабная обработка данных для пакетных рабочих нагрузок и рабочих нагрузок с потоковой передачей

Аналитика для всех ваших данных

Аналитика самых полных и актуальных данных

Совместная обработка и анализ данных

Упрощение и ускорение обработки и анализа крупных наборов данных

Создана на основе открытого кода

Быстрая, оптимизированная среда Apache Spark

Приступите к работе в кратчайшие сроки с оптимизированной средой Apache Spark

Azure Databricks предоставляет последние версии Apache Spark и обеспечивает тесную интеграцию с открытыми библиотеками. Ускорьте запуск кластеров и разработку в полностью управляемой среде Apache Spark благодаря глобальному масштабу и доступности платформы Azure. Кластеры устанавливаются, настраиваются и оптимизируются, чтобы обеспечить надежность и производительность без необходимости в мониторинге. Воспользуйтесь возможностями автомасштабирования и автоматического завершения, чтобы снизить совокупную стоимость владения.

Читать документацию по Azure Databricks

Повысьте продуктивность, используя общую рабочую область и распространенные языки

Обеспечьте эффективную совместную работу над общими проектами, используя интерактивную среду рабочих областей и записных книжек, которая подойдет для специалистов по бизнес-аналитике, инжинирингу данных, обработке данных и анализу данных. Выбирайте для разработки любой язык, например Python, Scala, R или SQL. Легко управляйте версиями записных книжек с помощью GitHub и Azure DevOps.

Узнайте, как создать рабочую область Azure Databricks

Эффективное машинное обучение с задействованием больших данных

Получите доступ к расширенным возможностям автоматизированного машинного обучения, используя интегрированную службу "Машинное обучение Azure", чтобы быстро определять подходящие алгоритмы и гиперпараметры. Упростите контроль, мониторинг и обновление моделей машинного обучения, развернутых из облака на пограничные устройства. Служба "Машинное обучение Azure" также предоставляет центральный реестр для ваших экспериментов, конвейеров машинного обучения и моделей.

Смотреть вебинар, посвященный Azure Databricks и службе "Машинное обучение Azure"

Получите высокопроизводительное современное хранилище данных

Совмещайте данные в любом масштабе и получайте полезные сведения из аналитических панелей мониторинга и эксплуатационных отчетов. Автоматизируйте перемещение данных с помощью службы "Фабрика данных Azure", а затем загружайте данные в Azure Data Lake Storage, преобразуйте и очищайте их с помощью Azure Databricks, а также делайте их доступными для аналитики с помощью Azure Synapse Analytics. Модернизируйте свое хранилище данных в облаке, чтобы обеспечить непревзойденные уровни производительности и масштабируемости.

Подробнее об аналитике в масштабе облака в Azure

Основные возможности службы

Оптимизированное ядро Spark

Простая обработка данных в автомасштабируемой инфраструктуре на основе высокооптимизированного решения Apache Spark™ позволяет увеличить производительность в 50 раз.

Среда выполнения машинного обучения

Доступ одним щелчком к предварительно настроенным средам машинного обучения позволяет использовать расширенные функции машинного обучения на современных и популярных платформах, таких как PyTorch, TensorFlow и scikit-learn.

MLflow

Отслеживайте эксперименты и делитесь ими, воспроизводите запуски и совместно управляйте моделями из центрального репозитория.

Выбор языка

Используйте удобный для вас язык, включая Python, Scala, R, Spark SQL и .NET, независимо от того, применяете ли вы бессерверные или подготовленные вычислительные ресурсы.

Совместная работа с записными книжками

Быстро получайте доступ к данным и изучайте их, находите полезные сведения и делитесь ими, а также совместно создавайте модели с помощью удобных для вас языков и инструментов.

Delta Lake

Обеспечьте надежность и масштабируемость существующего озера данных с помощью транзакционного уровня хранилища с открытым кодом, разработанного для всего жизненного цикла данных.

Интеграция платформенной функциональности со службами Azure

Дополните свое комплексное решение аналитики и машинного обучения глубокой интеграцией со службами Azure, такими как Фабрика данных, Azure Data Lake Storage, Машинное обучение Azure и Power BI.

Интерактивные рабочие области

Обеспечьте совместную работу инженеров данных, бизнес-аналитиков и специалистов по обработке и анализу данных.

Безопасность корпоративного уровня

Автоматическая встроенная система безопасности защищает ваши данные в месте их хранения и создает соответствующие требованиям частные изолированные рабочие области аналитики для тысяч пользователей и наборов данных.

Готовность к выпуску

Запускайте и масштабируйте свои критически важные рабочие нагрузки данных на надежной платформе с интеграцией экосистемы для CI/CD и мониторинга.

Примеры архитектуры решений

Аналитика в реальном времени для архитектуры больших данных

С легкостью получайте информацию из оперативных потоковых данных. Непрерывно собирайте данные с любых IoT-устройств или журналов кликов на веб-сайтах и обрабатывайте их в режиме реального времени.

Расширенная архитектура решения для аналитики

Преобразуйте свои данные в ценные практические сведения, используя лучшие в своем классе средства машинного обучения. Эта архитектура позволяет комбинировать любые данные при любом масштабе, а также создавать и развертывать пользовательские модели машинного обучения с масштабированием.

Управление жизненным циклом машинного обучения

Ускорьте комплексный жизненный цикл машинного обучения и управляйте им с помощью Azure Databricks, MLflow и Машинного обучения Azure для создания, совместного использования, развертывания приложений машинного обучения и управления ими.

Бескомпромиссная безопасность и конфиденциальность данных

  • Обеспечьте безопасность, мониторинг и контроль решений для работы с большими данными и аналитикой с помощью широкого спектра ведущих в отрасли функций обеспечения безопасности и соответствия требованиям.

  • Используйте единый вход и интеграцию с Azure Active Directory, чтобы специалисты по обработке данных могли уделять больше времени поиску аналитических сведений.

  • У Azure больше сертификатов, чем у любого другого поставщика облачных служб. См. полный список.

Подробнее о продуктах и службах Azure Databricks

Цены на Azure Databricks

Нам доверяют компании из различных отраслей

Обнаружение угроз безопасности с помощью глубокого обучения на основе облака

Компания Shell использует Azure, ИИ и машинное зрение, чтобы лучше защищать клиентов и сотрудников.

Узнать больше

Shell

Повышение производительности и экономии

Служба обработки данных renewablesAI использует Azure и Apache Spark для создания стабильного и прибыльного рынка солнечной энергии.

Узнать больше

Renewables AI

Реализация комплексного решения для аналитики в Azure

Поставщик логистических услуг LINX Cargo Care Group стимулирует инновации в масштабах компании с помощью Azure Databricks.

Узнать больше

LINX Cargo Care Group

Начало работы с Azure Databricks

Зарегистрируйте бесплатную учетную запись Azure, чтобы мгновенно получить доступ.

Прочтите документацию, чтобы научиться пользоваться службой Azure Databricks.

Ознакомьтесь с кратким руководством по созданию кластеров, записных книжек, таблиц и многого другого.

Сообщество и служба поддержки Azure

Задавайте вопросы и получайте ответы на них от специалистов Майкрософт и экспертов сообщества Azure на форумах MSDN и Stack Overflow или обратитесь в службу поддержки Azure.

Популярные задания и шаблоны

Изучите практические задания для самостоятельной работы и популярные шаблоны быстрого запуска для распространенных конфигураций, созданные специалистами Майкрософт и участниками сообщества.

Azure Databricks: актуальные новости и ресурсы

Часто задаваемые вопросы об Azure Databricks

  • Соглашение об уровне обслуживания Azure Databricks гарантирует доступность на протяжении 99,95 % времени.
  • Единица Databricks (DBU) — это единица обработки данных в час, использование которой тарифицируется посекундно.
  • Рабочая нагрузка инжиниринга данных — это задание, которое автоматически запускает и отключает кластер, в котором оно выполняется. Например, рабочую нагрузку может активировать планировщик заданий Azure Databricks, который запускает кластер Apache Spark исключительно для этого задания и автоматически завершает работу кластера после выполнения задания.
    Рабочая нагрузка аналитики данных не автоматизирована. Например, команды в записных книжках Azure Databricks выполняются в кластерах Apache Spark, пока они не будут остановлены вручную. Несколько пользователей могут использовать один кластер для совместного анализа.

Бесплатная учетная запись Azure готова к настройке в любой момент