Análisis de macrodatos e inteligencia artificial con Apache Spark optimizado
Obtén conclusiones a partir de todos tus datos y crea soluciones de inteligencia artificial (IA) con Azure Databricks, configura un entorno de Apache Spark™ en solo unos minutos, aplica escalabilidad automática y colabora en proyectos compartidos en un área de trabajo interactiva. Azure Databricks admite Python, Scala, R, Java y SQL, además de marcos y bibliotecas de ciencia de datos, como TensorFlow, PyTorch y scikit-learn.
Apache Spark™ es una marca comercial de Apache Software Foundation.
Ingeniería de datos confiable
Procesamiento de datos a gran escala para cargas de trabajo de streaming y por lotes.
Análisis para todos los datos
Habilita análisis para los datos más completos y recientes.
Ciencia de datos en colaboración
Simplifica y agiliza la ciencia de datos en los conjuntos de datos de gran tamaño.
Basado en código abierto
Entorno de Apache Spark rápido y optimizado.
Ponerse en marcha rápidamente con un entorno de Apache Spark optimizado
Azure Databricks proporciona las últimas versiones de Apache Spark y permite la integración sin problemas con bibliotecas de código abierto. Pon en marcha clústeres y crea soluciones con rapidez en un entorno de Apache Spark totalmente administrado, con la escala global y la disponibilidad de Azure. Los clústeres se instalan, configuran y ajustan para asegurar la confiabilidad y el rendimiento sin necesidad de supervisión. Aprovecha la escalabilidad y la terminación automáticas para mejorar el coste total de propiedad (TCO).
Impulsa la productividad con un área de trabajo compartida y lenguajes comunes
Colabora de forma eficaz en una plataforma abierta y unificada para ejecutar todos los tipos de cargas de trabajo de análisis, tanto si eres un científico de datos como si eres un ingeniero de datos o un analista de negocios. Crea soluciones con el lenguaje que prefieras, incluidos Python, Scala, R y SQL. Obtén funcionalidad sencilla de control de versiones para los cuadernos con GitHub y Azure DevOps.
Aumenta el potencial del aprendizaje automático con macrodatos
Accede a funcionalidades de aprendizaje automático avanzado y automatizado con el servicio integrado Azure Machine Learning para identificar con rapidez los algoritmos e hiperparámetros adecuados. Simplifica la administración, la supervisión y la actualización de los modelos de Machine Learning implementados desde la nube hasta el perímetro. Azure Machine Learning proporciona también un registro central de tus experimentos, modelos y canalizaciones de aprendizaje automático.
Obtén un almacenamiento de datos moderno de alto rendimiento
Combina datos a cualquier escala y extrae información a través de paneles analíticos e informes operativos. Automatiza el movimiento de los datos con Azure Data Factory; después, carga los datos en Azure Data Lake Storage, transfórmalos y límpialos con Azure Databricks y déjalos disponibles para analizarlos con Azure Synapse Analytics. Moderniza tu almacenamiento de datos en la nube para conseguir unos niveles inigualables de rendimiento y escalabilidad.
Principales características del servicio
-
Motor de Spark optimizado
Procesamiento de datos sencillo en una infraestructura con escalabilidad automática y basada en la tecnología Apache Spark™ altamente optimizada, que ofrece un rendimiento 50 veces superior.
-
Tiempo de ejecución del aprendizaje automático
Acceso con un solo clic a entornos de aprendizaje automático preconfigurados para lograr aprendizaje automático aumentado con marcos de trabajo de última generación y populares, como PyTorch, TensorFlow y scikit-learn.
-
MLflow
Realiza un seguimiento de los experimentos y compártelos, reproduce las ejecuciones y administra los modelos de forma conjunta desde un repositorio central.
-
Elige el lenguaje
Utiliza tu lenguaje preferido, incluidos Python, Scala, R, Spark SQL y .Net, tanto si usas recursos de proceso sin servidor como si usas recursos aprovisionados.
-
Cuadernos de colaboración
Accede a los datos y explóralos sin dilación, busca y comparte nuevas conclusiones, y crea modelos en colaboración con los lenguajes y las herramientas que prefieras.
-
Delta Lake
Aporta confiabilidad y escalabilidad a tu lago de datos actual con una capa de almacenamiento transaccional de código abierto diseñada para todo el ciclo de vida de los datos.
-
Integraciones nativas con los servicios de Azure
Completa tu solución integral de análisis y aprendizaje automático con la perfecta integración con los servicios de Azure, por ejemplo, Azure Data Factory, Azure Data Lake Storage, Azure Machine Learning y Power BI.
-
Áreas de trabajo interactivas
Permite una colaboración fluida entre científicos de datos, ingenieros de datos y analistas de negocios.
-
Seguridad de nivel empresarial
La seguridad nativa sin esfuerzo protege los datos donde reside y crea áreas de trabajo de análisis conformes, privadas y aisladas entre miles de usuarios y conjuntos de datos.
-
Preparado para producción
Ejecuta las cargas de trabajo de datos más críticas y modifica su escala con confianza en una plataforma de datos confiable, con integraciones del ecosistema para CI/CD y supervisión.
Más información con ejemplos de arquitectura de soluciones
Ciencia de datos y aprendizaje automático con Azure Databricks
Obtén conclusiones fácilmente de los datos de streaming en directo. Captura datos continuamente desde cualquier dispositivo IoT, o registros de los flujos de clics de los sitios web, y procésalos en tiempo casi real.
Arquitectura de análisis moderna con Azure Databricks
Transforma los datos en conclusiones procesables gracias a las mejores herramientas de aprendizaje automático de su clase. Esta arquitectura permite combinar cualquier dato a cualquier escala, y construir e implementar modelos de aprendizaje automático personalizados a escala.
Canalizaciones de ingesta, ETL y procesamiento de flujos con Azure Databricks
Acelera y administra el ciclo de vida completo del aprendizaje automático con Azure Databricks, MLflow y Azure Machine Learning para crear, compartir, implementar y administrar aplicaciones de aprendizaje automático.
Seguridad y cumplimiento normativo completos e integrados
-
Microsoft invierte más de USD$1,000,000,000 al año en la investigación y el desarrollo de la ciberseguridad.
-
Contamos con más de 3500 expertos en seguridad que se dedican a proteger la seguridad y la privacidad de los datos.
-
Azure tiene más certificaciones que cualquier otro proveedor de nube. Consulta la lista completa.
Más información sobre los productos y servicios de Azure Databricks
Azure Data Factory
Servicio de integración de datos híbridos que simplifica la extracción, transformación y carga de datos a escala.
Azure Data Lake Storage Gen 2
Funcionalidad de Data Lake segura y muy escalable creada sobre Azure Blob Storage.
Azure Machine Learning
Servicio de aprendizaje automático de nivel empresarial para crear e implementar modelos con más rapidez.
Power BI
Agrega análisis e informes interactivos a tus aplicaciones.
-
Precios de Azure Databricks
Pon en marcha clústeres rápidamente y aumenta o reduce los recursos de forma automática según tus necesidades de uso. Explora todas las opciones de precios de Azure Databricks.
Empieza a usar una cuenta gratuita de Azure
1
2
Después del crédito, cambia a un plan de pago por uso para seguir creando con los mismos servicios gratuitos. Paga solamente si tu uso supera la cantidad gratuita mensual.
3
Comunidad y soporte técnico de Azure
Formula preguntas y obtén soporte técnico de los ingenieros de Microsoft y expertos de la comunidad de Azure en el foro de MSDN y Stack Overflow, o bien ponte en contacto con el soporte técnico de Azure.
Laboratorios y plantillas populares
Descubre laboratorios autodirigidos y plantillas de inicio rápido populares para las configuraciones habituales que han creado Microsoft y la comunidad.
Explorar los recursos de Azure Databricks
Preguntas más frecuentes sobre Azure Databricks
-
El contrato de nivel de servicio de Azure Databricks garantiza una disponibilidad del 99,95 %.
-
Una unidad de Databricks (DBU) es una unidad de capacidad de procesamiento por hora cuyo uso se factura por segundo.
-
Una carga de trabajo de ingeniería de datos es un trabajo que comienza y termina automáticamente el clúster donde se ejecuta. Por ejemplo, una carga de trabajo puede desencadenarla el programador de trabajos de Azure Databricks, que inicia un clúster de Apache Spark solo para el trabajo y termina el clúster automáticamente cuando finaliza el trabajo.
Una carga de trabajo de análisis de datos no está automatizada. Por ejemplo, los comandos de cuadernos de Azure Databricks se ejecutan en clústeres de Apache Spark hasta que se terminan manualmente. Varios usuarios pueden compartir un clúster para analizarlo en colaboración.