Trace Id is missing
Пропустить и перейти к основному содержимому

Azure Databricks

Проектируйте решения искусственного интеллекта с использованием аналитики на базе Apache Spark™.

Аналитика больших данных и ИИ с использованием оптимизированного проекта Apache Spark

Получайте аналитические сведения на основе всех своих данных и создавайте решения с использованием искусственного интеллекта (ИИ) при помощи Azure Databricks, настройте среду Apache Spark™ за считанные минуты, обеспечьте автомасштабирование и участвуйте в совместной работе над общими проектами в интерактивной рабочей области. Azure Databricks поддерживает Python, Scala, R, Java и SQL, а также библиотеки и платформы обработки и анализа данных, включая TensorFlow, PyTorch и scikit-learn.

Apache Spark™ является товарным знаком компании Apache Software Foundation.

Прием данных и оркестрация с помощью Фабрики данных Azure. Подготовка, преобразование и обогащение данных с помощью Azure Databricks. Предоставление данных с помощью Azure Synapse Analytics. Хранение данных в Azure Data Lake Storage. Визуализация с помощью Power BI.

Надежный инжиниринг данных

Крупномасштабная обработка данных для пакетных рабочих нагрузок и рабочих нагрузок с потоковой передачей.

Аналитика для всех ваших данных

Аналитика самых полных и актуальных данных.

Совместная обработка и анализ данных

Упрощение и ускорение обработки и анализа крупных наборов данных.

Открытый код в основе

Быстрая и оптимизированная среда Apache Spark.

Приступите к работе в кратчайшие сроки с оптимизированной средой Apache Spark

Azure Databricks предоставляет последние версии Apache Spark и обеспечивает тесную интеграцию с открытыми библиотеками. Ускорьте запуск кластеров и разработку в полностью управляемой среде Apache Spark благодаря глобальному масштабу и доступности платформы Azure. Кластеры устанавливаются, настраиваются и оптимизируются, чтобы обеспечить надежность и производительность без необходимости в мониторинге. Воспользуйтесь возможностями автомасштабирования и автоматического завершения, чтобы снизить совокупную стоимость владения.

Пользователь создает новый кластер в Azure Databricks.
Общие сведения об Apache Spark в Databricks

Повысьте продуктивность, используя общую рабочую область и распространенные языки

Организуйте эффективное сотрудничество на открытой унифицированной платформе, позволяющей выполнять все типы рабочих нагрузок аналитики, кем бы вы ни были — специалистом по обработке и анализу данных, инженером данных или бизнес-аналитиком. Выбирайте для разработки любой язык, например Python, Scala, R или SQL. Легко управляйте версиями записных книжек с помощью GitHub и Azure DevOps.

Эффективное машинное обучение с задействованием больших данных

Получите доступ к расширенным возможностям автоматизированного машинного обучения, используя интегрированную службу "Машинное обучение Azure", позволяющую быстро определять подходящие алгоритмы и гиперпараметры. Упростите контроль, мониторинг и обновление моделей машинного обучения, развернутых из облака на пограничные устройства. Служба "Машинное обучение Azure" также предлагает центральный реестр для ваших экспериментов, конвейеров машинного обучения и моделей.

Рабочее пространство под названием "Модель машинного обучения" с Scikit-Learn в Azure Databricks
Прогноз относительно потребности в масштабировании в Azure Databricks.

Получите высокопроизводительное современное хранилище данных

Совмещайте данные в любом масштабе и получайте полезные сведения из аналитических панелей мониторинга и эксплуатационных отчетов. Автоматизируйте перемещение данных с помощью службы "Фабрика данных Azure", а затем загружайте данные в Azure Data Lake Storage, преобразуйте и очищайте их с помощью Azure Databricks, а также делайте их доступными для аналитики с помощью Azure Synapse Analytics. Модернизируйте свое хранилище данных в облаке, чтобы обеспечить непревзойденные уровни производительности и масштабируемости.

Основные возможности службы

  • a

    Оптимизированное ядро Spark

    Простая обработка данных в автомасштабируемой инфраструктуре на основе высокооптимизированного решения Apache Spark™ позволяет увеличить производительность в 50 раз.

  • a

    Среда выполнения машинного обучения

    Доступ одним щелчком к предварительно настроенным средам машинного обучения позволяет использовать расширенные функции машинного обучения на современных и популярных платформах, таких как PyTorch, TensorFlow и scikit-learn.

  • a

    MLflow

    Отслеживайте эксперименты и делитесь ими, воспроизводите запуски и совместно управляйте моделями из центрального репозитория.

  • c

    Выбор языка

    Используйте удобный для вас язык, включая Python, Scala, R, Spark SQL и .NET, независимо от того, применяете ли вы бессерверные или подготовленные вычислительные ресурсы.

  • c

    Совместная работа с записными книжками

    Быстро получайте доступ к данным и изучайте их, находите полезные сведения и делитесь ими, а также совместно создавайте модели с помощью удобных для вас языков и инструментов.

  • c

    Delta Lake

    Обеспечьте надежность и масштабируемость существующего озера данных с помощью транзакционного уровня хранилища с открытым кодом, разработанного для всего жизненного цикла данных.

  • v

    Интеграция платформенной функциональности со службами Azure

    Дополните свое комплексное решение аналитики и машинного обучения глубокой интеграцией со службами Azure, такими как Фабрика данных, Azure Data Lake Storage, Машинное обучение Azure и Power BI.

  • SPAR

    Интерактивные рабочие области

    Организуйте совместную работу инженеров данных, бизнес-аналитиков и специалистов по обработке и анализу данных.

  • d

    Безопасность корпоративного уровня

    Автоматическая встроенная система безопасности защищает ваши данные в месте их хранения и создает соответствующие требованиям частные изолированные рабочие области аналитики для тысяч пользователей и наборов данных.

  • s

    Готовность к выпуску

    Запускайте и масштабируйте свои критически важные рабочие нагрузки данных на надежной платформе с интеграцией экосистемы для CI/CD и мониторинга.

Примеры архитектуры решений

Обработка и анализ данных и машинное обучение с использованием Azure Databricks

С легкостью получайте информацию из оперативных потоковых данных. Непрерывно собирайте данные с любых IoT-устройств или журналов кликов на веб-сайтах и обрабатывайте их в режиме реального времени.

Архитектура современной аналитики с Azure Databricks

Преобразуйте свои данные в ценные практические сведения, используя лучшие в своем классе средства машинного обучения. Эта архитектура позволяет комбинировать любые данные при любом масштабе, а также создавать и развертывать пользовательские модели машинного обучения с масштабированием.

Конвейеры приема данных, извлечения, преобразования и загрузки, а также потоковой обработки с использованием Azure Databricks

Ускорьте комплексный жизненный цикл машинного обучения и управляйте им с помощью Azure Databricks, MLflow и Машинного обучения Azure для создания, совместного использования, развертывания приложений машинного обучения и управления ими.

Комплексные встроенные средства обеспечения безопасности и соответствия требованиям

Подробнее о продуктах и службах Azure Databricks

Фабрика данных Azure

Служба гибридной интеграции данных, которая упрощает извлечение, преобразование и загрузку данных в нужном масштабе.

Azure Data Lake Storage 2-го поколения

Надежное хранилище Data Lake Storage с высокой степенью масштабируемости, созданное на основе хранилища BLOB-объектов Azure.

Машинное обучение Azure

Служба машинного обучения корпоративного уровня для быстрого создания и развертывания моделей.

Power BI

Добавьте в свои приложения возможности аналитики и создания интерактивных отчетов.

Начните работу с бесплатной учетной записью Azure

1

Начните работу бесплатно. Получите на свой счет 200 USD, которые можно использовать в течение 30 дней. При наличии денег на счете вы можете бесплатно работать со многими нашими популярными службами в определенном объеме. Еще более 55 других служб будут всегда доступны вам бесплатно в рамках обозначенного объема.

2

Чтобы продолжать работу с этими службами, когда кредит будет израсходован, перейдите на оплату по мере использования. Плата будет взиматься только при использовании служб сверх предоставляемого бесплатно ежемесячного объема.

3

По истечении 12 месяцев вам все еще будут доступны более 55 служб, которые всегда предоставляются бесплатно. При этом вы по-прежнему будете платить только за те ресурсы, которые используете сверх бесплатно предоставляемого ежемесячного объема.

Сообщество и служба поддержки Azure

Задавайте вопросы и получайте ответы на них от специалистов Майкрософт и экспертов сообщества Azure на форумах MSDN и Stack Overflow или обратитесь в службу поддержки Azure.

Популярные задания и шаблоны

Часто задаваемые вопросы об Azure Databricks

  • Соглашение об уровне обслуживания Azure Databricks гарантирует доступность на протяжении 99,95 % времени.

  • Единица Databricks (DBU) — это единица обработки данных в час, использование которой тарифицируется посекундно.

  • Рабочая нагрузка инжиниринга данных — это задание, которое автоматически запускает и отключает кластер, в котором оно выполняется. Например, рабочую нагрузку может активировать планировщик заданий Azure Databricks, который запускает кластер Apache Spark исключительно для этого задания и автоматически завершает работу кластера после выполнения задания.

    Рабочая нагрузка аналитики данных не автоматизирована. Например, команды в записных книжках Azure Databricks выполняются в кластерах Apache Spark, пока они не будут остановлены вручную. Несколько пользователей могут использовать один кластер для совместного анализа.

Бесплатная учетная запись Azure готова к настройке в любой момент