跳过导航

Azure HDInsight

预配云 Hadoop、Spark、R Server、Hbase 和 Storm 群集

在开源平台中管理大数据需求

使用 Azure HDInsight(一项用于进行开源分析的可自定义企业级服务)运行常见的开源框架,包括 Apache Hadoop、Spark、Hive 和 Kafka 等。凭借 Azure 的全球规模,可轻松处理海量数据并享受广泛的开源项目生态系统的所有优势。轻松将大数据工作负载和处理迁移到云。

无需安装硬件或管理基础结构,即可轻松地快速启动开源项目和群集

大数据群集通过自动缩放和定价层降低成本,使你只需为所使用的内容付费

企业级安全性和行业领先的符合性(具有 30 多项认证)有助于保护你的数据

针对开源技术(如 Hadoop 和 Spark)的优化组件使你随时了解最新情况

在开源生态系统中生成项目

及时了解最新版本的开源框架,包括 Kafka、HBase 和 Hive LLAP。HDInsight 支持来自 Apache Hadoop 和 Spark 生态系统的最新开源项目。

与 Azure 服务进行本机集成

通过与 Azure 数据存储解决方案和服务(包括 Azure Synapse Analytics、Azure Cosmos DB、Azure Data Lake Storage、Azure Blob 存储、Azure 事件中心和 Azure 数据工厂)无缝集成来构建数据湖。通过从各种虚拟机中进行选择,并利用基于负载或计划的自动缩放功能来控制成本。使用 Azure Monitor 仪表板监视整个数据湖。

获得多种语言和工具的灵活性

使用首选的生产力工具,包括 Visual Studio、Eclipse、IntelliJ、Jupyter 和 Zeppelin。用 Scala、Python、R、JavaScript 和 .NET 等熟悉的语言编写代码。

分析工作负载的端到端安全性

  • 通过虚拟网络隔离保护群集,并使用 Azure 防火墙和 VNet 控制出站流量。
  • 使用企业域凭据通过 Azure Active Directory (Azure AD) 和多重身份验证进行登录。
  • 使用 Apache Ranger 强制执行精细的授权策略。享受数据掩码和行级筛选的优势。
  • 使用自己的加密密钥通过传输中的加密来保护端到端数据。

只为所需功能付费

HDInsight 提供了范围广泛的内存优化或计算优化平台(虚拟机)。选择最适合你的性能和成本要求的平台。

受到各种规模公司的信赖

Myntra 加速了其数字转型

Myntra 与 Microsoft 紧密合作,以将其平台(从供应链管理到库存再到站点功能)迁移到 Azure,以进行受信任、始终可用、超大规模和具有成本效益的计算。

Myntra

Gap Inc. 加速了其数字转型

通过在 Azure 上构建和集中其数据平台,Gap Inc. 现可应用高级分析和机器学习,以全面了解其项目组合中所有品牌的各个渠道的客户。

GAP

Azure HDInsight 更新、博客和公告

有关 HDInsight 的常见问题解答

  • 如果使用自定义代码通过最新的大数据处理框架(如 Spark、Hadoop、Hive、Kafka 或 Hbase)处理和分析超大型数据集,则会从 Azure HDInsight 中获益。通过 Azure HDInsight,你可以完全控制群集的配置以及安装在群集上的软件。如果要从本地环境或其他云迁移 Hortonworks、Cloudera 或 MapR 群集,也可以考虑使用 HDInsight。
  • Azure HDInsight 可用于大数据处理的各种场景。大数据可以是历史数据(已收集和存储的数据),也可以是实时数据(直接从源流式传输的数据)。处理此类数据的场景可以归纳为以下几类:批处理 (ETL)、数据仓库、物联网 (IoT)、数据科学和混合。
  • 若要了解有关 HDInsight 群集类型和预配方法的详细信息,请阅读有关如何使用 Apache Hadoop、Apache Spark、Apache Kafka 等在 HDInsight 中设置群集的文档。

准备就绪后,即可开始设置 Azure 免费帐户