Trace Id is missing
Saltar al contenido principal

Azure Databricks

Diseñar inteligencia artificial con análisis basados en Apache Spark™

Análisis de macrodatos e inteligencia artificial con Apache Spark optimizado

Obtén conclusiones a partir de todos tus datos y crea soluciones de inteligencia artificial (IA) con Azure Databricks, configura un entorno de Apache Spark™ en solo unos minutos, aplica escalabilidad automática y colabora en proyectos compartidos en un área de trabajo interactiva. Azure Databricks admite Python, Scala, R, Java y SQL, además de marcos y bibliotecas de ciencia de datos, como TensorFlow, PyTorch y scikit-learn.

Apache Spark™ es una marca comercial de Apache Software Foundation.

Ingesta y orquestación con Azure Data Factory. Preparación, transformación y enriquecimiento con Azure Databricks. Servicio con Azure Synapse Analytics. Almacenamiento con Azure Data Lake Storage. Visualización con Power BI.

Ingeniería de datos confiable

Procesamiento de datos a gran escala para cargas de trabajo de streaming y por lotes.

Análisis para todos los datos

Habilita análisis para los datos más completos y recientes.

Ciencia de datos en colaboración

Simplifica y agiliza la ciencia de datos en los conjuntos de datos de gran tamaño.

Basado en código abierto

Entorno de Apache Spark rápido y optimizado.

Ponerse en marcha rápidamente con un entorno de Apache Spark optimizado

Azure Databricks proporciona las últimas versiones de Apache Spark y permite la integración sin problemas con bibliotecas de código abierto. Pon en marcha clústeres y crea soluciones con rapidez en un entorno de Apache Spark totalmente administrado, con la escala global y la disponibilidad de Azure. Los clústeres se instalan, configuran y ajustan para asegurar la confiabilidad y el rendimiento sin necesidad de supervisión. Aprovecha la escalabilidad y la terminación automáticas para mejorar el coste total de propiedad (TCO).

Un usuario creando un clúster en Azure Databricks.
Una Introducción a Apache Spark en Databricks

Impulsa la productividad con un área de trabajo compartida y lenguajes comunes

Colabora de forma eficaz en una plataforma abierta y unificada para ejecutar todos los tipos de cargas de trabajo de análisis, tanto si eres un científico de datos como si eres un ingeniero de datos o un analista de negocios. Crea soluciones con el lenguaje que prefieras, incluidos Python, Scala, R y SQL. Obtén funcionalidad sencilla de control de versiones para los cuadernos con GitHub y Azure DevOps.

Aumentar el potencial del aprendizaje automático con macrodatos

Accede a funcionalidades de aprendizaje automático avanzada y automatizada con el servicio integrado Azure Machine Learning para identificar con rapidez los algoritmos e hiperparámetros adecuados. Simplifica la administración, la supervisión y la actualización de los modelos de Machine Learning implementados desde la nube hasta el perímetro. Azure Machine Learning proporciona también un registro central de tus experimentos, modelos y canalizaciones de aprendizaje automático.

Un área de trabajo llamada Modelo ML con Scikit-Learn en Azure Databricks
Una previsión de demanda de escalado en Azure Databricks.

Obtener un almacenamiento de datos moderno de alto rendimiento

Combina datos a cualquier escala y extrae información a través de paneles analíticos e informes operativos. Automatiza el movimiento de los datos con Azure Data Factory; después, carga los datos en Azure Data Lake Storage, transfórmalos y límpialos con Azure Databricks y déjalos disponibles para analizarlos con Azure Synapse Analytics. Moderniza tu almacenamiento de datos en la nube para conseguir unos niveles inigualables de rendimiento y escalabilidad.

Principales características del servicio

  • a

    Motor de Spark optimizado

    Procesamiento de datos sencillo en una infraestructura con escalabilidad automática y basada en la tecnología Apache Spark™ altamente optimizada, que ofrece un rendimiento 50 veces superior.

  • a

    Tiempo de ejecución del aprendizaje automático

    Acceso con un solo clic a entornos de aprendizaje automático preconfigurados para lograr aprendizaje automático aumentado con marcos de trabajo de última generación y populares, como PyTorch, TensorFlow y scikit-learn.

  • a

    MLflow

    Realiza un seguimiento de los experimentos y compártelos, reproduce las ejecuciones y administra los modelos de forma conjunta desde un repositorio central.

  • c

    Elegir el lenguaje

    Utiliza tu lenguaje preferido, incluidos Python, Scala, R, Spark SQL y .Net, tanto si usas recursos de proceso sin servidor como si usas recursos aprovisionados.

  • c

    Cuadernos de colaboración

    Accede a los datos y explóralos sin dilación, busca y comparte nuevas conclusiones, y crea modelos en colaboración con los lenguajes y las herramientas que prefieras.

  • c

    Delta Lake

    Aporta confiabilidad y escalabilidad a tu lago de datos actual con una capa de almacenamiento transaccional de código abierto diseñada para todo el ciclo de vida de los datos.

  • v

    Integraciones nativas con los servicios de Azure

    Completa tu solución integral de análisis y aprendizaje automático con la perfecta integración con los servicios de Azure, por ejemplo, Azure Data Factory, Azure Data Lake Storage, Azure Machine Learning y Power BI.

  • spar

    Áreas de trabajo interactivas

    Permite una colaboración fluida entre científicos de datos, ingenieros de datos y analistas de negocios.

  • d

    Seguridad de nivel empresarial

    La seguridad nativa sin esfuerzo protege los datos donde residen y crea áreas de trabajo de análisis conformes, privadas y aisladas entre miles de usuarios y conjuntos de datos.

  • s

    Preparado para producción

    Ejecuta las cargas de trabajo de datos más críticas y modifica su escala con confianza en una plataforma de datos confiable, con integraciones del ecosistema para CI/CD y supervisión.

Más información con ejemplos de arquitectura de soluciones

Ciencia de datos y aprendizaje automático con Azure Databricks

Obtén conclusiones fácilmente de los datos de streaming en directo. Captura datos continuamente desde cualquier dispositivo IoT, o registros de los flujos de clics de los sitios web, y procésalos en tiempo casi real.

Arquitectura de análisis moderna con Azure Databricks

Transforma los datos en conclusiones procesables gracias a las mejores herramientas de aprendizaje automático de su clase. Esta arquitectura permite combinar cualquier dato a cualquier escala, y construir e implementar modelos de aprendizaje automático personalizados a escala.

Canalizaciones de ingesta, ETL y procesamiento de flujos con Azure Databricks

Acelera y administra el ciclo de vida completo del aprendizaje automático con Azure Databricks, MLflow y Azure Machine Learning para crear, compartir, implementar y administrar aplicaciones de aprendizaje automático.

Seguridad y cumplimiento normativo completos e integrados

Más información sobre los productos y servicios de Azure Databricks

Azure Data Factory

Servicio de integración de datos híbridos que simplifica la extracción, transformación y carga de datos a escala.

Azure Data Lake Storage Gen 2

Funcionalidad de Data Lake segura y muy escalable creada sobre Azure Blob Storage.

Azure Machine Learning

Servicio de aprendizaje automático de nivel empresarial para crear e implementar modelos con más rapidez.

Power BI

Agrega análisis e informes interactivos a tus aplicaciones.

Empezar a utilizar una cuenta gratuita de Azure

1

Empieza gratis. Obtén un crédito de 200 USD para usar en un plazo de 30 días. Mientras tengas el crédito, obtendrás cantidades gratuitas de muchos de nuestros servicios más populares y cantidades gratuitas de otros 55 servicios que son siempre gratis.

2

Después del crédito, cambia a un plan de pago por uso para seguir creando con los mismos servicios gratuitos. Paga solamente si tu uso supera la cantidad gratuita mensual.

3

Transcurridos 12 meses, seguirás obteniendo más de 55 servicios que siempre son gratuitos y seguirás pagando solo por lo que uses más allá de las cantidades gratuitas mensuales.

Comunidad y soporte técnico de Azure

Formula preguntas y obtén soporte técnico de los ingenieros de Microsoft y expertos de la comunidad de Azure en el foro de MSDN y Stack Overflow, o bien ponte en contacto con el soporte técnico de Azure.

Laboratorios y plantillas populares

Preguntas más frecuentes sobre Azure Databricks

  • El contrato de nivel de servicio de Azure Databricks garantiza una disponibilidad del 99,95 %.

  • Una unidad de Databricks (DBU) es una unidad de capacidad de procesamiento por hora cuyo uso se factura por segundo.

  • Una carga de trabajo de ingeniería de datos es un trabajo que comienza y termina automáticamente el clúster donde se ejecuta. Por ejemplo, una carga de trabajo puede desencadenarla el programador de trabajos de Azure Databricks, que inicia un clúster de Apache Spark solo para el trabajo y termina el clúster automáticamente cuando finaliza el trabajo.

    Una carga de trabajo de análisis de datos no está automatizada. Por ejemplo, los comandos de cuadernos de Azure Databricks se ejecutan en clústeres de Apache Spark hasta que se terminan manualmente. Varios usuarios pueden compartir un clúster para analizarlo en colaboración.

Cuando quieras, podemos configurar tu cuenta gratuita de Azure