Azure Databricks

Serviço de análise rápido, fácil e colaborativo baseado no Apache SparkTM

Análise de Big Data e IA com Apache Spark otimizado

Descubra insights de todos os seus dados e crie soluções de IA (inteligência artificial) com o Azure Databricks, configure seu ambiente do Apache Spark™ em minutos, faça dimensionamento automático e colabore em projetos compartilhados em um workspace interativo. O Azure Databricks é compatível com Python, Scala, R, Java e SQL, além de estruturas de ciência de dados e bibliotecas, incluindo TensorFlow, PyTorch e scikit-learn.

O Apache Spark™ é uma marca da Apache Software Foundation.

Engenharia de dados confiável

Processamento de dados em larga escala para cargas de trabalho de streaming e de lote

Análise para todos os dados

Habilite a análise para os dados mais completos e recentes

Ciência de dados colaborativa

Simplifique e acelere a ciência de dados em conjuntos de dados de grande volume

Com raiz em software livre

Ambiente do Apache Spark rápido e otimizado

Comece rapidamente com um ambiente do Apache Spark otimizado

O Azure Databricks fornece as últimas versões do Apache Spark e permite a integração fácil com bibliotecas open-source. Acelere clusters e crie rapidamente em um ambiente do Apache Spark totalmente gerenciado com a escala global e a disponibilidade do Azure. Os clusters são definidos, configurados e ajustados para garantir confiabilidade e desempenho sem necessidade de monitoramento. Aproveite o dimensionamento e o término automáticos para aprimorar o TCO (custo total de propriedade).

Leia a documentação do Azure Databricks

Aumente a produtividade com um workspace compartilhado e linguagens comuns

Colabore com eficiência em uma plataforma aberta e unificada para executar todos os tipos de cargas de trabalho de análise, seja você um cientista de dados, um engenheiro de dados ou um analista de negócios. Crie com a linguagem de sua escolha, incluindo Python, Scala, R e SQL. Obtenha controle de versão fácil de notebooks com o GitHub e o Azure DevOps.

Saiba como criar um workspace no Azure Databricks

Impulsione o aprendizado de máquina em Big Data

Acesse as funcionalidades avançadas de machine learning automatizado usando o Azure Machine Learning integrado para identificar rapidamente os algoritmos e os hiperparâmetros adequados. Simplifique o gerenciamento, o monitoramento e a atualização de modelos de machine learning implantados da nuvem à borda. O Azure Machine Learning também fornece um registro central para seus experimentos, pipelines de aprendizado de máquina e modelos.

Assista a um webinar sobre o Azure Databricks e o Azure Machine Learning

Obtenha data warehouse moderno e de alto desempenho

Combine dados em qualquer escala e obtenha insights por meio de painéis analíticos e relatórios operacionais. Automatize a movimentação de dados usando o Azure Data Factory, depois carregue dados no Azure Data Lake Storage, transforme-os e limpe-os com o Azure Databricks e torne-os disponíveis para análise com o Azure Synapse Analytics. Modernize seu data warehouse na nuvem para níveis incomparáveis de desempenho e escalabilidade.

Saiba mais sobre a análise de escala de nuvem no Azure

Principais funcionalidades do serviço

Mecanismo otimizado do Spark

Processamento de dados simples na infraestrutura de dimensionamento automático, alimentado pelo Apache Spark™ altamente otimizado, resultando em ganhos de desempenho de até 50 vezes.

Tempo de execução de machine learning

Acesso com um clique a ambientes pré-configurados de machine learning para machine learning aprimorado com estruturas populares de ponta, como PyTorch, TensorFlow e scikit-learn.

MLflow

Acompanhe e compartilhe experimentos, reproduza execuções e gerencie modelos de maneira colaborativa de um repositório central.

Escolha de linguagem

Use sua linguagem preferida, incluindo Python, Scala, R, Spark SQL e .NET, quer você use recursos de computação sem servidor ou provisionados.

Notebooks colaborativos

Acesse e explore rapidamente dados, encontre e compartilhe novas informações e crie modelos de maneira colaborativa com as linguagens e ferramentas de sua escolha.

Delta Lake

Traga confiabilidade de dados e escalabilidade para seu data lake existente com uma camada de armazenamento transacional de software livre projetada para o ciclo de vida de dados completo.

Integrações nativas com serviços do Azure

Conclua sua solução de análise e machine learning de ponta a ponta com integração profunda com os serviços do Azure, como Azure Data Factory, Azure Data Lake Storage, Azure Machine Learning e Power BI.

Workspaces interativos

Habilite uma colaboração contínua entre cientistas de dados, engenheiros de dados e analistas de negócios.

Segurança de nível empresarial

A segurança nativa que não requer esforço protege seus dados onde eles estão e cria workspaces de análise, privados, isolados e em conformidade em milhares de usuários e conjuntos de dados.

Pronto para produção

Execute e escale suas cargas de trabalho de dados críticas com uma plataforma de dados confiável, com integrações de ecossistema para CI/CD e monitoramento.

Saiba mais por meio dos exemplos de arquitetura da solução

Análise em tempo real na arquitetura de Big Data

Obtenha facilmente insights de dados de streaming ao vivo. Capture dados continuamente de qualquer dispositivo IoT ou logs de sequência de cliques do site e processe-os em tempo quase real.

Arquitetura de análise avançada

Transforme seus dados em insights acionáveis usando as melhores ferramentas de aprendizado de máquina da categoria. Essa arquitetura permite combinar dados em qualquer escala e criar e implantar modelos de aprendizado de máquina personalizados em escala.

Gerenciamento do ciclo de vida de machine learning

Acelere e gerencie o ciclo de vida de machine learning de ponta a ponta com o Azure Databricks, o MLflow e o Azure Machine Learning para criar, compartilhar, implantar e gerenciar aplicativos de machine learning.

Segurança de dados e privacidade são fundamentais

  • Proteja, monitore e gerencie suas soluções de dados e análise com uma ampla gama de recursos de segurança e conformidade que são líderes do setor.

  • Use o logon único e a integração com o Azure Active Directory para possibilitar que profissionais de dados dediquem mais tempo a descobrir insights.

  • O Azure tem mais certificações do que qualquer outro provedor de nuvem. Veja uma lista abrangente.

Saiba mais sobre os produtos e os serviços do Azure Databricks

Preços do Azure Databricks

Com a confiança de empresas de vários setores

Como identificar danos de segurança usando aprendizado profundo baseado em nuvem

A Shell usa o Azure, a IA e a visão de máquina para proteger melhor seus clientes e funcionários.

Shell

Como acelerar o desempenho e aumentar as economias

O serviço de dados renewablesAI usa o Azure e o Apache Spark para ajudar a criar um mercado de energia solar estável e lucrativo.

Renewables AI

Como habilitar a solução de análises de ponta a ponta no Azure

O provedor de logística LINX Cargo Care Group impulsiona a inovação em toda a empresa usando o Azure Databricks.

LINX Cargo Care Group

Introdução ao Azure Databricks

Inscreva-se em uma conta gratuita do Azure para obter acesso instantâneo.

Leia a documentação para aprender como usar o Azure Databricks.

Explore o início rápido para criar clusters, notebooks, tabelas e mais.

Suporte do Azure e da comunidade

Faça perguntas e obtenha suporte dos engenheiros da Microsoft e dos especialistas da comunidade do Azure no Fórum do MSDN e Stack Overflow ou contate o suporte do Azure.

Laboratórios e modelos populares

Descubra laboratórios individuais e modelos de início rápido populares para configurações comuns feitos pela Microsoft e a comunidade.

Obtenha as notícias e os recursos mais recentes sobre o Azure Databricks

Atualizações, blogs e anúncios do Databricks

Perguntas frequentes sobre o Azure Databricks

  • O SLA do Azure Databricks garante 99,95% de disponibilidade.
  • Uma unidade do Databricks, ou DBU, é uma unidade de capacidade de processamento por hora, cobrada por uso por segundo.
  • A carga de trabalho de engenharia de dados é um trabalho que inicia e termina automaticamente o cluster no qual é executada. Por exemplo, uma carga de trabalho pode ser disparada pelo agendador de trabalhos do Azure Databricks, que inicia um cluster Apache Spark exclusivamente para o trabalho e termina o cluster automaticamente após a conclusão do trabalho.
    A carga de trabalho da análise de dados não é automatizada. Por exemplo, comandos nos notebooks do Azure Databricks são executados nos clusters do Apache Spark até que sejam terminados manualmente. Diversos usuários podem compartilhar um cluster para analisá-lo de forma colaborativa.

Estamos prontos para configurar sua conta gratuita do Azure quando você quiser