解决方案构想
本文是一种解决方案构想。 如果你希望我们在内容中扩充更多信息,例如潜在用例、备用服务、实现注意事项或定价指南,请通过提供 GitHub 反馈来告知我们。
此解决方案构想介绍如何使用 Azure HDInsight 的高级分析功能将本地大数据投资扩展到云并实现业务转型。
体系结构
下载此体系结构的 Visio 文件。
数据流
- 在本地基础结构与 Microsoft 数据中心之间建立 ExpressRoute,以允许通过专用连接从本地 Hadoop 设置将数据可靠、快速并且安全地复制到 Azure HDInsight 群集。
- 在 HDInsight 群集所在的同一 Azure 虚拟网络中安装 WANdisco Fusion 服务器,这样服务器就能够以安全的方式访问群集。
- 在 HDInsight 群集(新的或现有的)上安装 WANdisco Fusion 应用。 在许可证密钥字段中输入 Fusion Server 的公共 IP。
- 在 HDInsight 群集上配置 Fusion 应用,以设置从本地大数据/Hadoop 部署到 Azure HDInsight 的持续主动复制、多区域复制、备份和还原等。
组件
- Apache Hadoop 或 Apache Spark
- 元数据存储
- 本地边缘路由器
- Azure ExpressRoute 线路
- Microsoft Edge 路由器
- 数据复制(WANdisco 的 LiveData Migrator for Azure 和 LiveData Plane for Azure)
- Azure HDInsight
- Azure 虚拟网络
方案详细信息
此解决方案构想介绍如何将本地大数据投资扩展到云。
可能的用例
WANdisco Fusion 与 Azure HDInsight 的集成提供了企业解决方案,这个方案能够让组织满足严格的数据可用性和符合性要求,同时将 PB 规模的生产数据从本地大数据部署无缝移动到 Microsoft Azure。
作者
本文由 Microsoft 维护, 它最初是由以下贡献者撰写的。
首席作者:
- Aadi Manchanda | 云解决方案架构师
若要查看非公开的 LinkedIn 个人资料,请登录到 LinkedIn。
后续步骤
了解有关组件技术的详细信息:
- 什么是 Azure ExpressRoute?
- 使用适用于 Azure 的 WANDisco LiveData 平台迁移 Hadoop 数据湖
- 什么是 Azure HDInsight?
- 什么是 Azure 虚拟网络?
相关资源
探索相关体系结构: