Azure SQL Data Warehouse es ahora Azure Synapse Analytics

Publicado el 7 noviembre, 2019

Director of Product, Azure Data

El cuatro de noviembre, anunciamos Azure Synapse Analytics, la siguiente evolución de Azure SQL Data Warehouse. Azure Synapse es un servicio de análisis ilimitado que reúne el almacenamiento de datos empresariales y el análisis de macrodatos. Le ofrece la libertad de consultar los datos como prefiera, ya sea a petición sin servidor o con recursos aprovisionados, a escala. Azure Synapse combina estos dos mundos con una experiencia unificada para ingerir, preparar, administrar y servir datos para necesidades inmediatas de inteligencia empresarial y aprendizaje automático.

Con Azure Synapse, los profesionales de los datos pueden consultar datos tanto relacionales como no relacionales usando el lenguaje SQL que ya conocen. Esto se puede hacer mediante consultas a petición sin servidor para la exploración de datos y el análisis ad hoc o recursos aprovisionados para las necesidades de almacenamiento de datos más exigentes. Un único servicio para todas las cargas de trabajo.

De hecho, es el primer y único sistema de análisis que ha ejecutado todas las consultas de TPC-H a escala de petabyte. Para los clientes actuales de SQL Data Warehouse, puede seguir ejecutando las cargas de trabajo de almacenamiento de datos actuales en producción con Azure Synapse y beneficiarse automáticamente de las nuevas capacidades en versión preliminar cuando estén disponibles en general. Puede registrarse para la versión preliminar de las nuevas características, como la consulta a petición sin servidor, el estudio de Azure Synapse y la integración de Apache Spark™ .

  Diagrama que muestra cómo Azure Synapse Analytics conecta Power BI, Azure Machine Learning y su ecosistema.

Llevar SQL más allá del almacenamiento de datos

En la base de Azure Synapse, se encuentra un motor de procesamiento SQL distribuido, nativo de la nube, y es lo que permite al servicio admitir las cargas de trabajo de almacenamiento de datos empresariales más exigentes. Esta semana en Ignite presentamos varias características interesantes para facilitar el almacenamiento de datos con Azure Synapse y permitir a las organizaciones usar SQL para un conjunto de casos de uso de análisis más amplio.

Desbloquear más rápidamente conclusiones eficaces de todos los datos

Azure Synapse se integra profundamente con Power BI y Azure Machine Learning para impulsar conclusiones de todos los usuarios, desde la codificación de científicos de datos con estadísticas hasta el usuario empresarial con Power BI. Y, para que sean posibles todos los tipos de análisis, anunciamos la compatibilidad de la predicción nativa e integrada, así como mejoras del nivel de tiempo de ejecución de cómo Azure Synapse controla el streaming de datos, archivos Parquet y Polybase. Vamos a profundizar en los detalles:

  • Con la instrucción nativa PREDICT, puede puntuar los modelos de Machine Learning dentro del almacenamiento de datos, evitando la necesidad del movimiento de datos de gran tamaño y complejos. La función PREDICT (disponible en versión preliminar) se basa en el marco de modelo abierto y toma los datos de usuario como entrada para generar predicciones. Los usuarios pueden convertir los modelos existentes entrenados en Azure Machine Learning, Apache Spark™ u otros marcos en una representación de formato interno sin tener que empezar desde cero, acelerando el tiempo de conclusiones.

Diagrama que muestra cómo puede crear y cargar modelos para puntuarlos con SQL Analytics en Data Warehouse.

  • Hemos habilitado la compatibilidad de ingesta de streaming de datos directa y la posibilidad de ejecutar consultas analíticas sobre el streaming de datos. Capacidades como las uniones entre varias entradas de streaming, las agregaciones dentro de una o más entradas de streaming, la transformación de datos semiestructurados y varias ventanas temporales se admiten directamente en el entorno de almacenamiento de datos (disponible en versión preliminar). Para la ingesta de streaming, los clientes pueden integrarse con Event Hubs (incluido Event Hubs para Kafka) e IoT Hubs.

  • También estamos quitando la barrera que impide compartir datos de manera segura y fácil, dentro o fuera de la organización, con la integración de Azure Data Share para compartir datos de lago de datos y de almacenamiento de datos.

  • Con la nueva tecnología de ParquetDirect, logramos que las consultas interactivas en el lago de datos sean una realidad (en versión preliminar). Está diseñado para el acceso a archivos Parquet con compatibilidad nativa directamente integrada en el motor. Mediante los índices de examen mejorados, el almacenamiento en caché de datos inteligentes y el proceso por lotes de almacenamiento de columnas, hemos mejorado la ejecución de Polybase por encima de 13x.

Gráfico que muestra la mejora del rendimiento con ParquetDirect.

Aislamiento de cargas de trabajo

Para dar soporte técnico a los clientes a medida que democratizan sus almacenes de datos, anunciamos nuevas características para la administración inteligente de la carga de trabajo. La nueva funcionalidad de aislamiento de carga de trabajo le permite administrar la ejecución de cargas de trabajo heterogéneas mientras proporciona flexibilidad y control sobre los recursos de almacenamiento de datos. Esto lleva a una previsibilidad de la ejecución mejorada y amplía la capacidad de satisfacer los SLA predefinidos.

Imagen que muestra el aislamiento de la carga de trabajo en Data Warehouse.

Instrucción COPY

El análisis de datos a escala de petabyte requiere la ingesta de datos a escala de petabyte. Para simplificar el proceso de ingesta de datos, presentamos una instrucción COPY simple y flexible. Con solo un comando, Azure Synapse permite ahora la ingesta de datos continua en un almacenamiento de datos de manera rápida y segura.

Esta nueva instrucción COPY permite usar una única instrucción T-SQL para cargar datos, analizar archivos CSV estándar y más.

Código de ejemplo de instrucción COPY:

COPY INTO dbo.[FactOnlineSales] FROM 'https://contoso.blob.core.windows.net/Sales/'

Almacenamiento seguro de datos con seguridad inigualable

Azure dispone de las características de seguridad y privacidad más avanzadas del mercado. Estas características se integran en el tejido de Azure Synapse; por ejemplo, detección de amenazas avanzada y cifrado de datos siempre activo. Y, para obtener control de acceso pormenorizado, las empresas pueden mejorar la protección y la privacidad de sus datos usando la seguridad de nivel de fila nativa, la seguridad de nivel de columna y el enmascaramiento dinámico de los datos para proteger automáticamente los datos confidenciales en tiempo real.

Para mejorar más la seguridad y privacidad, presentamos Azure Private Link. Proporciona una manera segura y escalable de consumir recursos implementados desde su propia instancia de Azure Virtual Network (VNet). Una conexión segura se establece mediante un flujo de llamada basado en el consentimiento. Una vez establecida, todos los datos que fluyen entre Azure Synapse y los consumidores del servicio se aísla de Internet y permanece en la red de Microsoft. Ya no hay necesidad de puertas de enlace, dispositivos de traducción de direcciones de red (NAT) ni direcciones IP públicas para comunicarse con el servicio.

Imagen que muestra Azure Private Link, una manera segura y escalable de consumir recursos implementados desde su propia instancia de Azure Virtual Network (VNet).

Comience hoy mismo

Ahora las empresas pueden seguir ejecutando sus cargas de trabajo de almacenamiento de datos actuales en producción con las características de Azure Synapse que ya están disponibles con carácter general.


Azure. Invente con un objetivo.