Azure Databricks Delta en versión preliminar, se han agregado nueve regiones y se han hecho otros anuncios interesantes

Publicado el 24 septiembre, 2018

Group Product Manager, Azure Data

Azure Databricks ofrece una plataforma de análisis rápida, sencilla y de colaboración basada en Apache® Spark™ que acelera y simplifica el proceso de compilar soluciones de IA y macrodatos que impulsen la empresa, todo con el respaldo de contratos de nivel de servicio líderes del sector.

Desde que anunciamos la disponibilidad general en marzo, hemos estado atentos continuamente a los clientes y hemos agregado funcionalidad al servicio Azure Databricks. Hoy me complace anunciar diversas nuevas actualizaciones de Azure Databricks.

Disponibilidad general

Azure Databricks está ahora disponible en Japón, Canadá y Centro de Australia

Nos complace anunciarles la disponibilidad general de Azure Databricks en otras regiones: Japón, Canadá, India, Centro de Australia y Centro de Australia 2. Con estas ubicaciones adicionales, el número de productos disponibles en todo el mundo llega a 24 regiones, con el respaldo de un contrato de nivel de servicio del 99,95 %.

Queremos asegurarnos de que la finalidad de nuestra infraestructura en la nube es atender a las necesidades de los clientes, a la vez que impulsa la innovación y la hace accesible a nivel mundial. Manténgase al tanto de la disponibilidad por región de Azure Databricks.

Las organizaciones también se benefician de la integración nativa de Azure Databricks con otros servicios tales como Azure Blob Storage, Azure Data Factory, Azure SQL Data Warehouse y Azure Cosmos DB. Esto facilita nuevas soluciones de análisis que admiten escenarios modernos de almacenamiento de datos, análisis avanzado y análisis en tiempo real.

Acceso condicional de Azure Active Directory en Azure Databricks

Azure Databricks ahora facilita acceso condicional de Azure Active Directory (AD), lo que permite a los administradores controlar dónde y cuándo pueden los usuarios iniciar sesión en Azure Databricks.

La seguridad es una preocupación importante para las organizaciones que usan la nube. Un aspecto clave de la seguridad en la nube es la identidad y el acceso en lo referente a administrar los recursos de nube. En un mundo que da prioridad a los dispositivos móviles y la nube, los usuarios pueden acceder a los recursos de su organización mediante diversos dispositivos y aplicaciones desde cualquier parte. Como consecuencia de ello, ya no es suficiente con centrarse en quién puede acceder a un recurso. Para dominar el equilibrio entre seguridad y productividad, también debe incluir en la decisión sobre el control de acceso el modo en que se accede a los recursos. Con el acceso condicional de Azure Active Directory, puede abordar este requisito. El acceso condicional es una funcionalidad de Azure Active Directory. Con el acceso condicional, puede implementar decisiones de control de acceso automatizadas para el acceso a las aplicaciones en la nube que se basan en condiciones.

Los clientes pueden empezar hoy mismo a sacar partido del acceso condicional de Azure Active Directory en Azure Databricks creando una directiva de acceso condicional en Azure AD a través del portal. Obtenga más información sobre el acceso condicional de Azure AD en la documentación de Azure Databricks.

Vista previa

Azure Databricks Delta

Azure Databricks Delta, disponible ya en versión preliminar, es una eficaz capa de almacenamiento de transacciones creada en Apache Spark que ofrece mejor coherencia de los datos y acceso de lectura más rápido.

Dado que los clientes continúan construyendo complejas canalizaciones tanto para datos por lotes como para datos de streaming, es necesario simplificar las canalizaciones de extracción, transformación y carga de datos (ETL). Para generar una vista coherente, los clientes suelen crear varias fases en la canalización para dar cabida a esquemas en evolución, así como para admitir patrones lambda con distintas fases del procesamiento de lotes y flujos.

Azure Databricks Delta se puede utilizar con tablas de Spark para permitir que varios usuarios o trabajos modifiquen simultáneamente un conjunto de datos y obtenga vistas coherentes, lo que puede hacerse sin interferir con otros trabajos que lean el mismo conjunto de datos de la tabla. Azure Databricks Delta aprovecha los archivos Parquet, pero mantiene un registro de transacciones que permite una mejor administración de archivos organizando los datos en archivos grandes que pueden estar listos con mucha mayor eficacia. También ha integrado estadísticas que mejoran el rendimiento al aprovechar la omisión de datos para evitar la lectura de información irrelevante.

Azure Databricks Delta ya está disponible en versión preliminar. Puede obtener más información al respecto en nuestra documentación e importar nuestro bloc de notas de inicio rápido.

Azure Databricks admite Azure SQL Data Warehouse como receptor de streaming

Nos complace anunciar que los usuarios de Azure Databricks pueden transmitir datos directamente a Azure SQL Data Warehouse con flujos estructurados. Así, los clientes pueden visualizar y realizar informes de datos casi en tiempo real en SQL DW con el respaldo de canalizaciones de streaming en tiempo real construidas con flujos estructurados, lo que se traduce en una toma de decisiones más rápida en toda la empresa.

Con el crecimiento explosivo del volumen de datos que se analiza, la proliferación de diferentes tipos de datos y la necesidad de análisis en tiempo real, se requiere un único centro para visualizar todos los datos. Azure SQL Data Warehouse (SQL DW) es un almacenamiento de datos empresarial en la nube que aprovecha el procesamiento paralelo masivo (MPP) para ejecutar rápidamente consultas complejas en petabytes de datos. El almacenamiento de datos puede actuar como la única versión de verdad con la que su empresa puede contar a efectos de visualización y conclusiones.

Ámbitos de secreto compatibles con Azure Key Vault y Azure Databricks

Azure Databricks incluye la posibilidad de conectarse a Azure Data Lake Storage, Cosmos DB, SQL DW, Event Hubs, IoT Hubs y varios servicios más. Ahora tenemos la posibilidad de permitir que los clientes almacenen cadenas de conexión o secretos en Azure Key Vault.

Azure Key Vault puede ayudarle a almacenar y gestionar de forma segura los secretos de las aplicaciones, lo que reduce las posibilidades de pérdida accidental de información de seguridad al centralizar el almacenamiento de secretos.

Al utilizar Key Vault con Azure Databricks para crear ámbitos de secretos, los científicos y desarrolladores de datos ya no tienen que almacenar información de seguridad como tokens SAS o cadenas de conexiones en sus portátiles. El acceso a un almacén de claves requiere una autorización y autenticación correctas para que un usuario pueda obtener acceso. La autenticación establece la identidad del usuario, mientras que la autorización determina las operaciones que puede realizar.

Con esto, Azure Databricks admite ahora dos tipos de ámbitos de secretos: compatible con Azure Key Vault y compatible con Databricks. Más información sobre el ámbito de secretos compatible con Azure Key Vault.

Spark + AI Summit, Europa

Microsoft tendrá una importante presencia en Spark + AI Summit Europe, 2018, el primer evento de la comunidad de Apache Spark. Rohan Kumar, vicepresidente corporativo de Azure Data, dará una ponencia sobre cómo Azure Databricks combina lo mejor de la plataforma de análisis Apache® Spark™ y los servicios de Microsoft Azure Data para ayudar a los clientes a liberar el poder de los datos y replantearse posibilidades que facilitan la IA y mejoran nuestro mundo. En Spark + AI Summit, incluimos un número de sesiones que muestran el gran trabajo que nuestros clientes y asociados están haciendo y cómo Azure Databricks les ayuda a alcanzar la productividad a escala.

Comience hoy mismo

Nos alegramos de que pruebe Azure Databricks. Comience hoy mismo y envíenos sus comentarios.