Omitir navegación

Azure Data Lake Store

Massively scalable, secure data lake functionality built on Azure Blob Storage

Get powerful data lake functionality at cloud scale

Azure Data Lake Storage Gen2 es una solución de lago de datos rentable y muy escalable para el análisis de macrodatos. Combina el potencial de un sistema de archivos de alto rendimiento con escala masiva y economía para ayudarle a obtener conclusiones con rapidez. Data Lake Storage Gen2 amplía la funcionalidad de Azure Blob Storage y está optimizado para cargas de trabajo analíticas. Almacene los datos una vez y acceda a ellos desde interfaces de sistema de archivos compatibles con Blob Storage y HDFS, sin cambios de programación ni copia de datos. Data Lake Storage Gen2 es el lago de datos más completo disponible.

Read the blog

See more videos

Fast

Pruebe modelos en menos tiempo con un sistema de archivos compatible con Hadoop que admite operaciones atómicas de archivos y carpetas, y que está optimizado para ejecutar trabajos a la velocidad del rayo.

Escalable

Aproveche la escala global, la durabilidad y el rendimiento de Azure Blob Storage, incluida la admisión de cuentas de almacenamiento masivo.

Secure

Nuestro sistema de archivos de lago de datos está diseñado para satisfacer los requisitos más exigentes de seguridad de los datos empresariales. Ofrece compatibilidad con listas de control de acceso pormenorizado conformes con POSIX, seguridad de almacén de objetos con cifrado en reposo, integración con Azure Active Directory y firewalls de cuentas de almacenamiento.

Rentable

Get data lake functionality at cloud object store pricing levels. Data Lake Storage Gen2 provides the same lifecycle policy management and object-level tiering that’s built into Blob Storage.

Service capabilities

Massive scalability

Near limitless storage for analytics data

Cloud object store pricing

Same low-cost data storage model as Azure Blob Storage

Fewer file and folder transactions

Atomic transactions for fewer compute cycles and faster job execution

Granular file and folder security

POSIX-compliant, fine-grained access control lists (ACLs)

Simplified ingestion in a single store

Consolidated data storage using the Data Lake Storage Gen2 or Blob Storage REST API

Full Azure Blob Storage feature set

Data lifecycle policy management; hot, cool, and archive tiers; and high availability/disaster recovery support

Role-based access and storage account firewalls

Multi-layer security to govern data access so only users from authorized IPs can perform analytics

Common data model (CDM) support

Ability to exchange data with powerful applications like Microsoft Dynamics 365 (for CRM) and Power BI

Trusted partners

  • Informatica Cloud
  • Attunity
  • WANDisco
  • Striim
  • Qubole
  • Cloudera

¿Qué se puede hacer con Data Lake Storage?

Almacenamiento de datos moderno

新式数据仓库通过新式数据仓库可轻松将所有数据汇集到一起,并通过分析仪表板、操作报告或所有用户的高级分析获取见解。12354
  1. Información general
  2. Flujo

Información general

Los almacenamientos de datos modernos le permiten reunir fácilmente todos sus datos a cualquier escala y obtener información detallada mediante paneles de análisis, informes operativos o análisis avanzados para todos sus usuarios.

Flujo

  1. 1 Combine en Azure Blob Storage todos sus datos estructurados, no estructurados y semiestructurados (registros, archivos y multimedia) con Azure Data Factory.
  2. 2 Aproveche los datos en Azure Blob Storage para realizar análisis escalables con Azure Databricks y lograr datos limpios y transformados.
  3. 3 Los datos limpios y transformados se pueden trasladar a Azure SQL Data Warehouse y, allí, combinarlos con los datos estructurados existentes para crear un centro para todos sus datos. Saque partido a los conectores nativos entre Azure Databricks y Azure SQL Data Warehouse para acceder a los datos y moverlos a escala.
  4. 4 Cree informes operativos y paneles analíticos en Azure Data Warehouse para extraer información detallada de los datos, y use Azure Analysis Services para servirlos a miles de usuarios finales.
  5. 5 Ejecute consultas puntuales directamente a los datos dentro de Azure Databricks.

Análisis avanzados de macrodatos

大数据高级分析使用领先机器学习工具将数据转化为可行见解。通过这种架构,可将任何规模的数据进行组合,且可大规模构建和部署自定义机器学习模型。1234576
  1. Información general
  2. Flujo

Información general

Transforme los datos en información procesable gracias a las mejores herramientas de aprendizaje automático de su clase. Esta arquitectura le permite combinar cualquier dato a cualquier escala, y construir e implementar modelos de aprendizaje automático personalizados a escala.

Flujo

  1. 1 Reúna en Azure Blob Storage todos sus datos estructurados, no estructurados y semiestructurados (registros, archivos y multimedia) con Azure Data Factory.
  2. 2 Use Azure Databricks para limpiar y transformar los conjuntos de datos sin estructura y combinarlos con datos estructurados de bases de datos o almacenamientos de datos operativos.
  3. 3 Utilice técnicas escalables de aprendizaje automático o aprendizaje profundo para obtener información más detallada de estos datos mediante Python, R o Scala y disfrute de experiencias de cuaderno integradas en Azure Databricks.
  4. 4 Saque partido a los conectores nativos entre Azure Databricks y Azure SQL Data Warehouse para acceder a los datos y moverlos a escala.
  5. 5 Los usuarios avanzados aprovecharán las funcionalidades integradas de Azure Databricks para realizar análisis de la causa principal y análisis de datos sin procesar.
  6. 6 Ejecute consultas puntuales directamente a los datos dentro de Azure Databricks.
  7. 7 Lleve los conocimientos de Azure Databricks a Cosmos DB para que sean accesibles mediante aplicaciones web y móviles.

Análisis en tiempo real

实时分析轻松从实时流数据中获取见解。 持续从所有 IoT 设备或网站点击流日志捕获数据,并准实时地处理数据。12348765
  1. Información general
  2. Flujo

Información general

Obtenga información detallada fácilmente a partir de los datos de streaming en vivo. Capture datos continuamente desde dispositivos IoT o registros de los flujos de clics de los sitios web, y procéselos en tiempo casi real.

Flujo

  1. 1 Ingiera fácilmente datos de streaming en vivo de una aplicación con un cluster de Apache Kafka en Azure HDInsight.
  2. 2 Reúna en Azure Blob Storage todos sus datos estructurados mediante Azure Data Factory.
  3. 3 Use Azure Databricks para limpiar, transformar y analizar los conjuntos de datos y combinarlos con datos estructurados de bases de datos o almacenamientos de datos operativos.
  4. 4 Utilice técnicas escalables de aprendizaje automático o aprendizaje profundo para obtener información más detallada de estos datos mediante Python, R o Scala y disfrute de experiencias de cuaderno integradas en Azure Databricks.
  5. 5 Saque partido a los conectores nativos entre Azure Databricks y Azure SQL Data Warehouse para acceder a los datos y moverlos a escala.
  6. 6 Cree paneles de análisis e informes integrados en Azure Data Warehouse para compartir la información detallada en su organización y use Azure Analysis Services para servir estos datos a miles de usuarios.
  7. 7 Los usuarios avanzados aprovecharán las funcionalidades integradas de Azure Databricks y Azure HDInsight para realizar análisis de la causa principal y análisis de datos sin procesar.
  8. 8 Lleve los conocimientos de Azure Databricks a Cosmos DB para que sean accesibles mediante aplicaciones en tiempo real.

Productos y servicios relacionados

Azure Databricks

Plataforma de análisis rápida, sencilla y de colaboración basada en Apache Spark

Data Factory

Integración fácil de datos híbridos a escala empresarial

SQL Data Warehouse

Almacenamiento de datos elástico como servicio con características de clase empresarial

Get started with Azure Data Lake Storage