HDInsight

适用于企业的托管开源大数据分析服务

Azure HDInsight 是一种适用于企业的托管开源大数据分析服务。你可以为 Hadoop、Spark、Hive、HBase、Storm、Kafka、和 Microsoft R Server 创建优化的群集,并提供 99.9% SLA 支持。

提供业内领先 SLA 的托管服务开源分析

与其他在基础 VM 上提供 SLA 的服务不同,HDInsight 是行业内唯一在工作负荷上提供端到端 SLA 的服务。为 Hadoop、Spark、Hive、HBase、Storm、Kafka、和 Microsoft R Server 创建优化的群集,并提供 99.9% SLA 的支持。使用这些构建基块,可完成包含 ETL、仓储、数据科学、IoT 和流式处理的方案,并扩展本地投资。使用 HDInsight,可以运行这些方案作为具有企业级安全性的生产就绪解决方案,并在数分钟内在 Azure 上实现监视功能。

HDInsight 适用于 Hadoop 项目,如 Apache HBase、Apache Storm、Apache Hive、Apache Spark 和 Apache Kafka

全球覆盖

适用于全球超过 25 个区域 - 适用范围超越其他任何大数据分析产品。同样适用于 Azure 政府云和中国。

安全性和符合性

借助 HDInsight 保护数据资产并将本地安全和管理控制扩展到云。通过 Azure Active Directory,获取单一登录 (SSO)、多重身份验证以及针对数百万个标识的无缝管理。通过精细的访问控制策略,授权用户和组使用 Apache Ranger 访问所有企业数据。HDInsight 符合美国健康保险流通与责任法案 (HIPAA)、支付卡行业 (PCI) 和服务组织控制 (SOC),从而帮助确保企业数据资产始终得到良好的保护。为支持最高水平的业务连续性,HDInsight 扩展了警报、监视和定义强占式操作的功能,并通过与 Azure 的监视套件的本机集成强化了工作负荷保护。

面向开发人员和科学家的高生产力平台

将 Hadoop 和 Spark 的丰富生产力套件与你喜欢的开发环境(例如 Visual StudioEclipse)结合使用,并支持 IntelliJ for Scala、Python、R、Java 和 .NET。数据科学家可合并代码、统计方程和可视化内容,将 JupyterZeppelin 这两种最广泛使用的笔记本进行集成,提炼有关数据的信息。HDInsight 也是唯一与 Microsoft R Server 集成的托管云 Hadoop 解决方案。与开源 R 相比,R Server 中的多线程数学库和透明并行能够多处理达 1000 倍的数据并且处理速度也能加快至 50 倍,从而帮助你定型更准确的模型以获得比之前更好的预测。

具成本效益的云缩放

通过分离计算和存储,有效扩展或缩减工作负荷。仍可使用本地存储处理高速缓存和快速 I/O。Spark 和交互式 Hive 用户可选择使用 SSD 内存以便提升交互性能,而 Kafka 用户则可将所有流数据保留在高级托管磁盘中。选择可实现最大资源利用率的任意 Azure 虚拟机类型,仅为所用计算和存储空间付费。

可扩展性最强的平台

具有领先 ISV 的 HDInsight 合作伙伴用于提供易于使用的一键式可扩展应用框架

在部署群集的过程中,可通过部署 ISV(如 Cask、Streamsets 和 H20.AI 等)来扩展 Hadoop、Spark 和 Kafka 分析平台的功能。

使用 Azure HDInsight 可以生成什么?

了解以下用例

物联网 + 流式处理应用程序

丰田 Connected Car、Office 365 和 Bing Ads 通过 Kafka、Storm 和 Spark Streaming 在 HDInsight 实现实时大数据处理,每秒处理数以百万的事件。

了解更多

数据科学 + 机器学习

通过向应用程序和组织添加智能特性来转换业务。

了解更多

数据仓库

对任意格式的结构化或非结构化数据执行 PB 级交互查询,生成模型,并连接到你喜欢的 BI 工具。

了解更多

与 Azure HDInsight + 本地混合

将本地投资扩展至云,并利用云中的高级分析和 BI 产品/服务来转换业务。

了解更多

客户通过 Azure HDInsight 支持大数据分析

HDInsight 学习路径