概述
为高性能分析建立基础
使用单个存储平台消除数据孤岛。通过分层存储和策略管理优化成本。使用 Microsoft Entra ID(前 Azure Active Directory)和基于角色的访问控制 (RBAC) 对数据进行身份验证。借助静态加密和高级威胁防护等安全功能,帮助保护数据。
- 借助 Azure 全局基础结构,满足任何容量要求并轻松管理数据。以始终如一的高性能运行大规模分析查询。
- 通过涵盖加密、数据访问和网络级控制的功能保护数据湖,所有这些功能都旨在帮助你更安全地获得见解。
- 使用各种不同的数据引入工具大规模引入数据。使用 Azure Databricks、Azure Synapse Analytics 或 Azure HDInsight 处理数据。并通过 Microsoft Power BI 对数据进行可视化,从而获取转型见解。
- 通过独立缩放存储和计算来优化成本,这是本地数据湖无法实现的功能。根据使用情况上调或下调层级,并利用自动化生命周期管理策略来优化存储成本。
功能
密钥存储平台功能
可伸缩性
通过自动异地复制实现无限制的缩放和 16 个 9 的数据持久性。
安全性
高度安全存储,具有灵活的跨数据访问、加密和网络级控制的保护机制。
分析
用于引入、处理和可视化的单一存储平台,支持最常见的分析框架。
优化
通过独立缩放存储和计算、生命周期策略管理和对象级分层实现成本优化。
安全
嵌入的安全性和合规性
34,000
Microsoft 专职从事安全项目的全职等效工程师数量。
15,000
具备专业安全专长的合作伙伴。
>100
合规认证,包括超过 50 项针对全球区域和国家/地区的认证。
客户案例
深受各种规模公司的信赖
资源
开发人员资源
常见问题解答
常见问题解答
- 在 Blob 上添加分层命名空间可以保留云存储的成本优势,并且不会影响大数据分析框架专门为之设计的文件系统接口。
一个简单的示例是分析作业将输出数据写入临时目录,然后在提交阶段将该目录重命名为最终名称的频繁发生模式。在对象存储(设计为不支持目录的概念)中,这些重命名可能是涉及 N 个复制和删除操作的冗长操作,其中 N 是目录中的文件数。使用分层命名空间时,这些目录操作具有原子性,能够提高性能和优化成本。此外,支持目录作为文件系统的元素允许应用符合 POSIX 的访问控制列表 (ACL),该列表使用父目录来传播权限。 - 与其他云存储服务类似,Data Lake Storage 根据存储的数据量以及对该数据执行操作所产生的成本计费。请参阅成本明细。
- Data Lake Storage 主要设计用于 Hadoop 和所有使用 Hadoop FileSystem 作为其数据访问层(例如 Spark 和 Presto)的框架。查看详细信息。
在 Azure 中,Data Lake Storage 可与下列操作互操作:
- Azure 数据工厂
- Azure HDInsight
- Azure Databricks
- Azure Synapse Analytics
- Power BI
- Data Lake Storage 为数据访问控制提供了多种机制。通过提供分层命名空间,该服务是唯一采用符合 POSIX 的访问控制列表 (ACL) 的云分析存储,该列表构成了 Hadoop 分布式文件系统 (HDFS) 权限的基础。Data Lake Storage 还包括通过存储防火墙、专用终结点、强制执行 TLS 1.2 和使用系统或客户提供的密钥的静态加密实现的传输级安全功能。
Azure 解决方案
详细了解 Azure 云解决方案
使用成熟的 Azure 云服务组合,结合示例体系结构和文档来解决业务问题。
业务解决方案中心
查找合适的 Microsoft Cloud 解决方案
探索 Microsoft 业务解决方案中心,查找可帮助组织实现目标的产品和解决方案。