Análise de Big Data e IA com Apache Spark otimizado
Descubra insights de todos os seus dados e crie soluções de IA (inteligência artificial) com o Azure Databricks, configure seu ambiente do Apache Spark™ em minutos, faça dimensionamento automático e colabore em projetos compartilhados em um workspace interativo. O Azure Databricks é compatível com Python, Scala, R, Java e SQL, além de estruturas de ciência de dados e bibliotecas, incluindo TensorFlow, PyTorch e scikit-learn.
O Apache Spark™ é uma marca da Apache Software Foundation.
Engenharia de dados confiável
Processamento de dados em larga escala para cargas de trabalho de streaming e de lote.
Análise para todos os dados
Habilite a análise para os dados mais completos e recentes.
Ciência de dados colaborativa
Simplifique e acelere a ciência de dados em conjuntos de dados de grande volume.
Desbloqueado por rooting em software livre
Ambiente do Apache Spark rápido e otimizado.
Comece rapidamente com um ambiente do Apache Spark otimizado
O Azure Databricks fornece as últimas versões do Apache Spark e permite a integração fácil com bibliotecas de código aberto. Acelere clusters e crie rapidamente em um ambiente do Apache Spark totalmente gerenciado com a escala global e a disponibilidade do Azure. Os clusters são definidos, configurados e ajustados para garantir confiabilidade e desempenho sem necessidade de monitoramento. Aproveite o dimensionamento e o término automáticos para aprimorar o TCO (custo total de propriedade).
Aumente a produtividade com um workspace compartilhado e linguagens comuns
Colabore com eficiência em uma plataforma aberta e unificada para executar todos os tipos de cargas de trabalho de análise, seja você um cientista de dados, um engenheiro de dados ou um analista de negócios. Crie com a linguagem de sua escolha, incluindo Python, Scala, R e SQL. Obtenha controle de versão fácil de notebooks com o GitHub e o Azure DevOps.
Impulsione o aprendizado de máquina em Big Data
Acesse as funcionalidades avançadas de aprendizado de máquina automatizado usando o Azure Machine Learning integrado para identificar rapidamente os algoritmos e os hiperparâmetros adequados. Simplifique o gerenciamento, o monitoramento e a atualização de modelos de aprendizado de máquina implantados da nuvem à borda. O Azure Machine Learning também fornece um registro central para seus experimentos, pipelines de aprendizado de máquina e modelos.
Obtenha data warehouse moderno e de alto desempenho
Combine dados em qualquer escala e obtenha insights por meio de painéis analíticos e relatórios operacionais. Automatize a movimentação de dados usando o Azure Data Factory, depois carregue dados no Azure Data Lake Storage, transforme-os e limpe-os com o Azure Databricks e torne-os disponíveis para análise com o Azure Synapse Analytics. Modernize seu data warehouse na nuvem para níveis incomparáveis de desempenho e escalabilidade.
Principais funcionalidades do serviço
-
Mecanismo otimizado do Spark
Processamento de dados simples na infraestrutura de dimensionamento automático, alimentado pelo Apache Spark™ altamente otimizado, resultando em ganhos de desempenho de até 50 vezes.
-
Tempo de execução de aprendizado de máquina
Acesso com um clique a ambientes de aprendizado de máquina pré-configurados para aprendizado de máquina otimizado com estruturas populares e de última geração, como PyTorch, TensorFlow e scikit-learn.
-
MLflow
Acompanhe e compartilhe experimentos, reproduza execuções e gerencie modelos de maneira colaborativa de um repositório central.
-
Escolha de linguagem
Use sua linguagem preferida, incluindo Python, Scala, R, Spark SQL e .NET, quer você use recursos de computação sem servidor ou provisionados.
-
Notebooks colaborativos
Acesse e explore rapidamente dados, encontre e compartilhe novas informações e crie modelos de maneira colaborativa com as linguagens e ferramentas de sua escolha.
-
Delta Lake
Traga confiabilidade de dados e escalabilidade para seu data lake existente com uma camada de armazenamento transacional de software livre projetada para o ciclo de vida de dados completo.
-
Integrações nativas com serviços do Azure
Conclua sua solução de análise e aprendizado de máquina de ponta a ponta com integração profunda aos serviços do Azure, como Azure Data Factory, Azure Data Lake Storage, Azure Machine Learning e Power BI.
-
Workspaces interativos
Habilite uma colaboração contínua entre cientistas de dados, engenheiros de dados e analistas de negócios.
-
Segurança de nível empresarial
A segurança nativa que não requer esforço protege seus dados onde eles estão e cria workspaces de análise, privados, isolados e em conformidade em milhares de usuários e conjuntos de dados.
-
Pronto para produção
Execute e escale suas cargas de trabalho de dados críticas com uma plataforma de dados confiável, com integrações de ecossistema para CI/CD e monitoramento.
Saiba mais por meio dos exemplos de arquitetura da solução
Ciência de dados e aprendizado de máquina com o Azure Databricks
Obtenha facilmente insights de dados de streaming ao vivo. Capture dados continuamente de qualquer dispositivo IoT ou logs de sequência de cliques do site e processe-os em tempo quase real.
Arquitetura de análise moderna com o Azure Databricks
Transforme seus dados em insights acionáveis usando as melhores ferramentas de aprendizado de máquina da categoria. Essa arquitetura permite combinar dados em qualquer escala e criar e implantar modelos de aprendizado de máquina personalizados em escala.
Pipelines de ingestão, de ETL e de processamento de fluxos com o Azure Databricks
Acelere e gerencie o ciclo de vida de aprendizado de máquina de ponta a ponta com o Azure Databricks, o MLflow e o Azure Machine Learning para criar, compartilhar, implantar e gerenciar aplicativos de aprendizado de máquina.
Segurança e conformidade abrangentes, internas
-
A Microsoft investe mais de USD$ 1 bilhão por ano em pesquisa e desenvolvimento de segurança cibernética.
-
Empregamos mais de 3.500 especialistas em segurança totalmente dedicados à privacidade e à segurança de dados.
-
O Azure tem mais certificações do que qualquer outro provedor de nuvem. Confira a lista completa.
Saiba mais sobre os produtos e os serviços do Azure Databricks
Azure Data Factory
Serviço de integração híbrida de dados que simplifica o ETL em escala.
Azure Data Lake Storage Gen 2
Funcionalidade de data lake segura e amplamente escalonável criada no Armazenamento de Blobs do Azure.
Azure Machine Learning
Serviço de aprendizado de máquina de nível corporativo para criar e implantar modelos mais rapidamente.
Power BI
Adicione relatórios interativos e analíticos aos seus aplicativos.
-
Preços do Azure Databricks
Acelere clusters e escale ou reduza de forma automática com base em suas necessidades de uso. Explore todas as opções de preço do Azure Databricks.
Comece a usar a conta gratuita do Azure
1
2
Após seu crédito, mova para pré-pago para continuar a construir com os mesmos serviços gratuitos. Pague apenas pelo que você usar além das suas quantidades mensais gratuitas.
3
Suporte do Azure e da comunidade
Faça perguntas e obtenha suporte dos engenheiros da Microsoft e dos especialistas da comunidade do Azure no Fórum do MSDN e Stack Overflow, ou contate o suporte do Azure.
Laboratórios e modelos populares
Descubra laboratórios individuais e modelos de início rápido para configurações comuns feitos pela Microsoft e pela comunidade.
Explore os recursos do Azure Databricks
Perguntas frequentes sobre o Azure Databricks
-
O SLA do Azure Databricks garante 99,95% de disponibilidade.
-
Uma unidade do Databricks, ou DBU, é uma unidade de capacidade de processamento por hora, cobrada por uso por segundo.
-
A carga de trabalho de engenharia de dados é um trabalho que inicia e termina automaticamente o cluster no qual é executada. Por exemplo, uma carga de trabalho pode ser disparada pelo agendador de trabalhos do Azure Databricks, que inicia um cluster Apache Spark exclusivamente para o trabalho e termina o cluster automaticamente após a conclusão do trabalho.
A carga de trabalho da análise de dados não é automatizada. Por exemplo, comandos nos notebooks do Azure Databricks são executados nos clusters do Apache Spark até que sejam terminados manualmente. Diversos usuários podem compartilhar um cluster para analisá-lo de forma colaborativa.