Apache Kafka for HDInsight

针对实时数据的高吞吐量、低延迟托管服务

Kafka for HDInsight 是一项企业级开源流采集服务,它成本效益高,且易于设置、管理和使用。可生成实时解决方案,如 物联网 (IoT)、欺诈检测、点击流分析、财务警报和社交分析。

每秒对数百万事件进行流式处理

处理由 Kafka for HDInsight 的实时应用程序生成的大量数据。Apache Kafka 是一种热门的开源流采集代理。可处理来自成千上万的客户端的每秒读取数和写入数。使用与 Apache Storm for HDInsightApache Spark for HDInsight 的现成集成,设计强大的流式传输管道,促进智能实时操作。


Apache Hadoop® 和关联的开放源项目名称都是 Apache Software Foundation 的商标。

数据从各种事件源(应用程序、设备、传感器、Web、社交)传入,并且通过 Web API 或域网关收集到云。数据流由 Kafka for HDInsight 引入,用于处理和分析 Azure 机器学习、Spark for HDInsight、Storm for HDInsight 和存储适配器等服务。借助 HDInsight 上的 Apache HBase、DocumentDB、MonoDB SQL、Solr Azure、Data Lake store 和 Azure 搜索等服务,数据变为长期存储。然后即可运行实时仪表板、查询和分析,或者发送数据到设备进行操作。

企业级管理和控制

通过 Microsoft Operations Management Suite 使用威胁检测、监视和管理,查看和控制实时解决方案。捕获日志、事件和 Java 管理扩展 (JMX) 指标以定义强占式操作,并使用 Azure 自动化 Runbook 设置警报。可执行统计聚合并生成丰富的可视化内容,以便进行报告和监视。

可安心使用,且支持开源

Kafka for HDInsight 由 Microsoft 管理和支持,提供全天候的企业支持和群集监视。公开上市时,HDInsight 将保证 Kafka 群集在 99.9% 的时间正常运行。

轻松设置,快速获取结果

使用 Kafka for HDInsight,无需花时间进行安装或设置。Azure 替你完成操作。使用功能全面的门户或通过简单的 JSON 模板,为配置部署托管的 Kafka 群集。群集将在几分钟内启动并运行,采集低延迟、高吞吐量的数据。只需为使用的计算和存储空间付费,无需购买新硬件或支付其他前期成本。

试用 Kafka for HDInsight