Azure Databricks

Servicio de análisis rápido, sencillo y de colaboración basado en Apache SparkTM

Análisis de macrodatos e inteligencia artificial con Apache Spark optimizado

Obtenga conclusiones a partir de todos sus datos y cree soluciones de inteligencia artificial (IA) con Azure Databricks, configure un entorno de Apache Spark™ en solo unos minutos, aplique escalabilidad automática y colabore en proyectos compartidos en un área de trabajo interactiva. Azure Databricks admite Python, Scala, R, Java y SQL, además de marcos y bibliotecas de ciencia de datos, como TensorFlow, PyTorch y scikit-learn.

Apache Spark™ es una marca comercial de Apache Software Foundation.

Ingeniería de datos confiable

Procesamiento de datos a gran escala para cargas de trabajo de streaming y por lotes.

Análisis para todos los datos

Habilite análisis para los datos más completos y recientes.

Ciencia de datos en colaboración

Simplifique y agilice la ciencia de datos en los conjuntos de datos de gran tamaño.

Basado en código abierto

Entorno de Apache Spark rápido y optimizado.

Póngase en marcha rápidamente con un entorno de Apache Spark optimizado

Azure Databricks proporciona las últimas versiones de Apache Spark y permite la integración sin problemas con bibliotecas de código abierto. Ponga en marcha clústeres y cree soluciones con rapidez en un entorno de Apache Spark totalmente administrado, con la escala global y la disponibilidad de Azure. Los clústeres se instalan, configuran y ajustan para asegurar la confiabilidad y el rendimiento sin necesidad de supervisión. Aproveche la escalabilidad y la terminación automáticas para mejorar el costo total de propiedad (TCO).

Consulte la documentación de Azure Databricks

Impulse la productividad con un área de trabajo compartida y lenguajes comunes

Colabore de manera eficaz en proyectos compartidos usando la experiencia de cuadernos y el área de trabajo interactiva, tanto si es un ingeniero o un científico de datos como si es un analista empresarial. Cree soluciones con el lenguaje que prefiera, incluidos Python, Scala, R y SQL. Obtenga funcionalidad sencilla de control de versiones para los cuadernos con GitHub y Azure DevOps.

Vea cómo crear un área de trabajo de Azure Databricks

Aumente el potencial del aprendizaje automático con macrodatos

Acceda a funcionalidad de aprendizaje automático avanzado y automatizado con el servicio integrado Azure Machine Learning para identificar con rapidez los algoritmos e hiperparámetros adecuados. Simplifique la administración, la supervisión y la actualización de los modelos de Machine Learning implementados desde la nube hasta el perímetro. Azure Machine Learning proporciona también un registro central de sus experimentos, modelos y canalizaciones de aprendizaje automático.

Vea un seminario web sobre Azure Databricks y Azure Machine Learning

Obtenga un almacenamiento de datos moderno de alto rendimiento

Combine datos a cualquier escala y extraiga información a través de paneles analíticos e informes operativos. Automatice el movimiento de los datos con Azure Data Factory; después, cargue los datos en Azure Data Lake Storage, transfórmelos y límpielos con Azure Databricks y déjelos disponibles para analizarlos con Azure Synapse Analytics. Modernice su almacenamiento de datos en la nube para conseguir unos niveles inigualables de rendimiento y escalabilidad.

Más información sobre los análisis a escala de nube en Azure

Principales características del servicio

Motor de Spark optimizado

Procesamiento de datos sencillo en una infraestructura con escalabilidad automática y basada en la tecnología Apache Spark™ altamente optimizada, que ofrece un rendimiento 50 veces superior.

Tiempo de ejecución del aprendizaje automático

Acceso con un solo clic a entornos de aprendizaje automático preconfigurados para lograr aprendizaje automático aumentado con marcos de trabajo de última generación y populares, como PyTorch, TensorFlow y scikit-Learn.

MLflow

Realice un seguimiento de los experimentos y compártalos, reproduzca las ejecuciones y administre los modelos de forma conjunta desde un repositorio central.

Elegir el lenguaje

Utilice su lenguaje preferido, incluidos Python, Scala, R, Spark SQL y .Net, tanto si usa recursos de proceso sin servidor como si usa recursos aprovisionados.

Cuadernos de colaboración

Acceda a los datos y explórelos sin dilación, busque y comparta información y cree modelos en colaboración con los lenguajes y las herramientas que prefiera.

Delta Lake

Aporte confiabilidad y escalabilidad a su lago de datos actual con una capa de almacenamiento transaccional de código abierto diseñada para todo el ciclo de vida de los datos.

Integración nativa con los servicios de Azure

Complete su solución integral de análisis y aprendizaje automático con la perfecta integración con los servicios de Azure, como Azure Data Factory, Azure Data Lake Storage, Azure Machine Learning y Power BI.

Áreas de trabajo interactivas

Habilite la colaboración entre científicos de datos, ingenieros de datos y analistas de negocios.

Seguridad de nivel empresarial

La seguridad nativa sin esfuerzo protege los datos donde residen y crea áreas de trabajo de análisis conformes, privadas y aisladas entre miles de usuarios y conjuntos de datos.

Preparado para producción

Ejecute las cargas de trabajo de datos más críticas y modifique su escala con confianza en una plataforma de datos confiable, con integraciones del ecosistema para CI/CD y supervisión.

Obtenga más información con ejemplos de arquitectura de soluciones

Análisis en tiempo real en una arquitectura de macrodatos

Extraiga información fácilmente de los datos de streaming en vivo. Capture datos continuamente desde dispositivos IoT o registros de los flujos de clics de los sitios web, y procéselos en tiempo casi real.

Arquitectura de análisis avanzada

Transforme los datos en información procesable gracias a las mejores herramientas de aprendizaje automático de su clase. Esta arquitectura le permite combinar cualquier dato a cualquier escala, y construir e implementar modelos de aprendizaje automático personalizados a escala.

Administración del ciclo de vida del aprendizaje automático

Acelere y administre el ciclo de vida completo del aprendizaje automático con Azure Databricks, MLflow y Azure Machine Learning para crear, compartir, implementar y administrar aplicaciones de aprendizaje automático.

La privacidad y la seguridad de los datos no son negociables

  • Proteja , supervise y administre sus soluciones de datos y análisis con una amplia gama de características de seguridad y cumplimiento líderes del sector.

  • Use el inicio de sesión único y la integración con Azure Active Directory para permitir que los profesionales de los datos dediquen más tiempo a extraer información.

  • Azure tiene más certificaciones que cualquier otro proveedor de nube. Vea una lista completa.

Más información acerca de los productos y servicios de Azure Databricks

Precios de Azure Databricks

Compañías de todos los sectores confían en él

Identificar riesgos de seguridad con aprendizaje profundo basado en la nube

Shell utiliza Azure e inteligencia y visión artificiales para proteger mejor a sus clientes y empleados.

Shell

Acelerar el rendimiento y aumentar el ahorro de costos

El servicio de datos renewablesAI utiliza Azure y Apache Spark para ayudar a crear un mercado de energía solar estable y rentable.

Renewables AI

Habilitar una solución de análisis completa en Azure

El proveedor de logística LINX Cargo Care Group impulsa la innovación en toda la compañía con Azure Databricks.

LINX Cargo Care Group

Comience a usar Azure Databricks

Regístrese para obtener una cuenta gratuita de Azure que le dará acceso al instante.

Consulte la documentación para aprender a usar Azure Databricks.

Explore la guía de inicio rápido para crear un clúster, un cuaderno, una tabla, etc.

Comunidad y soporte técnico de Azure

Formule preguntas y obtenga soporte técnico de los ingenieros de Microsoft y expertos de la comunidad de Azure en el foro de MSDN y Stack Overflow, o bien póngase en contacto con el servicio Soporte técnico de Azure.

Laboratorios y plantillas populares

Descubra laboratorios autodirigidos y plantillas de inicio rápido populares para las configuraciones habituales que han creado Microsoft y la comunidad.

Obtenga las noticias y los recursos más recientes de Azure Databricks

Preguntas más frecuentes sobre Azure Databricks

  • El acuerdo de nivel de servicio de Azure Databricks garantiza una disponibilidad del 99,95 %.
  • Una unidad de Databricks (DBU) es una unidad de capacidad de procesamiento por hora cuyo uso se factura por segundo.
  • Una carga de trabajo de ingeniería de datos es un trabajo que comienza y termina automáticamente el clúster en el que se ejecuta. Por ejemplo, una carga de trabajo puede desencadenarla el programador de trabajos de Azure Databricks, que inicia un clúster de Apache Spark solo para el trabajo y termina el clúster automáticamente cuando finaliza el trabajo.
    La carga de trabajo de análisis de datos no está automatizada. Por ejemplo, los comandos de cuadernos de Azure Databricks se ejecutan en clústeres de Apache Spark hasta que se terminan manualmente. Varios usuarios pueden compartir un clúster para analizarlo en colaboración.

Cuando quiera, podemos configurar su cuenta gratuita de Azure