定义数据迁移:什么是数据迁移?
一般而言,数据迁移是指移动数字信息。将该信息传输到其他位置、文件格式、环境、存储系统、数据库、数据中心或应用程序,都符合数据迁移的定义。
更具体地定义数据迁移:
数据迁移是选择、准备、提取和转换数据并将其从一个计算机存储系统永久传输到另一个计算机存储系统的过程。
数据迁移是常见的 IT 活动。但是,数据资产可能处于许多不同的状态和位置,这使得某些迁移项目比其他迁移项目更复杂,在技术上也更具挑战性。数据资产的示例包括:
- 存储在许多不同设备上且未分组的各种文件。
- 应用程序、操作系统和环境。
- 关系数据库,例如 SQL Server、MySQL、PostgreSQL 和 MariaDB。
- 非结构化数据库,例如 MongoDB、Azure Cosmos DB、DocumentDB、Cassandra、Couchbase、HBase、Redis 和 Neo4j。
- 数据湖、数据 Blob 和整个数据中心。
因此,数据迁移项目需要规划、实施和验证,确保能够成功迁移。在此处详细了解云迁移和其他类型的迁移。
规划数据迁移
在开始收集云数据迁移的要求和范围之前,组织就需要先发现和评估他们实际拥有的数据。他们必须绘制数据地图,了解数据量、数据的多样化程度,以及数据的质量和状态。
他们也需评估迁移对组织的影响、确定利益干系人以及具有相关专业知识的人、分配责任、设置预算和日程表,以及针对每个人如何就数据迁移项目进行沟通达成一致的协议。
确定项目范围后,团队会设计迁移,包括选择移动数据时将使用的数据迁移软件和硬件、创建数据迁移规范,以及确定迁移数据量:一次迁移所有数据、一次迁移一小部分数据,或介于这两者之间的任意数据量。许多组织会寻求帮助和指导来适当调整迁移规模,尤其是要迁移到云端时。
实施数据迁移
完成规划并设计好迁移后,团队将开始实施。他们会根据规划阶段提出的要求和分步迁移指南分步迁移指南构建数据迁移解决方案,并开始传输数据。
数据迁移时,团队会对其进行监视和测试,以确保数据正确地传输且不存在冲突、数据质量问题、重复和异常情况。此监视和测试在镜像生产环境的环境中进行,使团队能够快速识别和修正数据迁移时产生的任何问题。
验证数据迁移
在迁移所有数据并完成实施后,团队将审核新配置中的数据并验证数据是否已准确传输。只有在技术和业务利益干系人以及可能使用数据的任何其他人(包括客户)验证数据迁移后,团队才会停止使用旧数据配置。
组织可能会出于多种不同的原因而需要或选择迁移数据。概括而言,这些原因包括降低成本、实现创新、提高性能、创建更高的可用性,以及加强安全性。当组织决定迁移数据时,他们需要考虑数据的完整性、迁移成本,以及对企业及其客户的影响。
可能需要数据迁移的一些特定场景和业务案例包括:
-
升级或替换旧版硬件或软件,使组织能够满足其性能要求或更具竞争力。
-
通过迁移到占用较小空间且消耗较少能源的系统,来降低对环境的影响并降低运营成本。
-
通过迁移到云,减少或消除在本地数据中心托管数据的费用。
-
将数据集中在一起以实现并促进互操作性,或重新定位到更安全的数据中心。
-
备份数据,使组织能够更好地准备和执行灾难恢复。
-
需要在现代化工作中迁移数据的组织通常会寻求设置其云环境和完成端到端云数据迁移方面的关于 Azure 迁移和现代化计划的专家建议和帮助专家建议和帮助。 详细了解云迁移的好处。
数据迁移与数据转换:有何区别?
若要更清楚地了解数据迁移的含义,就必须知道数据转换的含义,以及数据转换与数据迁移的关联性。对于某项活动或项目究竟是属于数据转换还是数据迁移,通常容易产生混淆,因为根据定义,数据迁移包括数据转换。但是,数据转换只是数据迁移的一个方面,因此这两个术语不能互为同义词。
数据迁移是指将数据从一个位置移动到另一个位置,而数据转换是指将数据从一种格式转换为另一种格式。下面的比较重点介绍了数据迁移和数据转换之间的更多差异和相似之处。
数据迁移 | 数据转换 |
---|---|
数据将移动到新的数据中心、位置、系统或环境。 | 数据将移动到新应用程序。数据中心、系统或环境可能保持不变。 |
数据的格式可能保持不变。 | 数据的格式已转换。 |
该过程包括规划、实施和验证。 | 该过程包括提取、转换和加载。 |
数据迁移通常包括数据转换,但数据转换并不总是必需的。 | 数据转换通常是数据迁移前几步中的其中一个步骤,但数据迁移可以在不进行数据转换的情况下发生。 |
数据迁移可以引入新的应用程序,以不同于旧版应用程序读取信息的方式读取信息。若要让旧版应用程序使用的数据能够与新应用程序配合使用,团队必须将数据转换为新系统可以理解和使用的格式。该转换过程就是数据转换。通过数据转换,团队可以将数据从旧版应用程序移动到完全不同的应用程序或同一应用程序的不同版本。从源中提取数据,将其转换为新格式,然后加载到新应用程序中。
通常,执行成功的数据迁移意味着团队需要在数据迁移过程的早期先转换数据,然后再将数据迁移到新位置。数据转换不包括分析、清理、验证或(在移动数据之后)对数据执行质量保证测试。因此,这不再是数据迁移与数据转换之间的区别问题,而是项目如何包括数据迁移和数据转换的问题。
这些不是唯一的数据迁移类型,一个数据迁移项目可以包括多种类型的数据迁移。例如,如果组织决定将数据从本地服务器移动到由云提供商运营的服务器,则该项目可能就属于云迁移和数据库迁移。这五个类别很有帮助,因为它们提供了数据迁移方案的一般概述以及组织可能进行该特定类型的数据迁移的原因。
存储迁移
存储迁移是最基本的数据迁移类型,符合数据迁移的字面定义。这些迁移包括将数据从一个存储设备移动到新的或不同的存储设备。该设备可以位于同一栋建筑中,也可以位于距离很远的不同数据中心内。该设备也可能属于不同类型,例如从硬盘驱动器移到固态驱动器。将数据迁移到云或者从一个云提供商迁移到另一个云提供商也是一种存储迁移,尽管这些类型的数据迁移的细节大多被视为云迁移。
当组织发现需要升级其设备或基础结构以实现更快的性能或节省缩放成本时,他们可以选择进行存储迁移。新技术还可使组织能够更有效地管理、保护、备份或恢复数据。在存储迁移期间,组织也有机会清理和验证数据,尽管在此类数据迁移期间组织选择更改数据格式的情况较少。
数据库迁移
这种类型的数据迁移通常需要数据转换,因为数据库迁移通常涉及将大量数据移动到更新的或不同的数据库引擎或数据库管理系统。数据库迁移比存储迁移更复杂,因为不仅传输的数据更多,而且数据的格式也可能会发生变化。
当组织需要升级其数据库软件、将数据库迁移到云或更改数据库供应商时,可能需要进行数据库迁移。在开始迁移之前,团队必须确保数据库具有适当的容量并进行测试,以确保对使用数据库的应用程序没有任何影响。
应用程序迁移
应用程序迁移涉及将数据移动到新的计算环境。这种类型的数据迁移是结合了其他几种数据迁移的数据迁移示例。迁移应用程序可能会涉及数据库迁移和存储迁移这两者。应用程序使用的数据库需要重新定位(有时甚至需要修改格式以通过数据转换适应新的数据模型),以及应用程序安装和运行所需的文件和目录结构。
当组织用于执行业务功能的软件、提供软件的供应商或软件所在的平台发生变化时,组织可能会执行应用程序迁移。
云迁移
与其他两种类型的数据迁移(存储迁移和应用程序迁移)非常相似,这种类型的数据迁移涉及对数据或应用程序进行移动。关键方面是,云数据迁移专门指将数据或应用程序从专用的本地数据中心传输到云或从一个云环境传输到另一个云环境。迁移的程度将会有所不同。云迁移可能涉及将所有数据、应用程序和服务迁移到云,或者可能只需要迁移一部分内容以满足战略目的或业务需求。
迁移到云使组织能够以更少的限制进行缩放,更轻松地预配资源,更科学地进行升级,更有效地使用资金,以及更快地进行创新。由于组织的数据和应用程序驻留在云中,因此他们不再需要维护在本地存储这些资产的计算机和基础结构。
业务流程迁移
此数据迁移类型是指移动数据和应用程序,以便更好地管理或运营企业本身。在业务流程迁移中,组织可以传输为产品、客户体验、运营和实践提供服务的任何类型的数据,包括数据库和应用程序。
组织可以进行这种类型的数据迁移,以优化或重新组织业务运行方式、更好地参与市场竞争、提供新产品或服务,或者完成兼并或收购。
数据迁移工具
为了执行迁移,团队将使用各种数据迁移工具来移动数据并根据需要对其进行修改。某些团队将选择从头开始构建自己的数据迁移工具。构建数据迁移工具的优点是,团队可以根据其特定系统和使用量身定制工具。但是,为数据迁移软件编码可能需要大量时间,需要大量手动集成和重新实现工作,并且产生的成本可能比数据迁移过程的其他部分更高昂。自编写脚本数据迁移工具在缩放或处理许多输入源方面也可能会遇到问题。
相反,团队可能会选择使用现有的数据迁移软件来简化数据迁移的行为,提高迁移速度并提升效率。通常,软件专门用于帮助进行特定类型的迁移,例如将 SQL Server 数据库移动到云端。但即使使用软件,团队仍需要全面了解他们正在移动的数据、迁移的数据量、迁移时间、需要对数据进行哪些更改,以及传输完成后是否有任何问题需要解决。这些团队还需要在本地数据迁移工具和云数据迁移工具之间进行选择。
可使用的数据迁移软件
团队可以从本地、基于云或自编写脚本的数据迁移软件中进行选择。通常,当数据和目标系统都在现场且在同一组织内时,本地工具的运行效果很好;当移动不同的数据系统或平台重塑为云时,基于云的工具最适合;而自编写脚本的工具适合于小型和针对性很强的项目。但是,由于数据迁移项目非常复杂,因此在从可用的不同类型的数据迁移软件中进行选择时,需要考虑更多因素。此图表根据给定迁移方案的功能建议适合的工具。
自编写脚本工具 | 本地工具 | 基于云的工具 | |
---|---|---|---|
数据卷和类型 | | | |
少量 | | | |
大量 | | | |
支持的格式 | | | |
不支持的格式 | | | |
源和目标 | | | |
单站点源 | | | |
多站点源 | | | |
云目标 | | | |
本地目标 | | | |
常见源和目标 | | | |
不常见的源和目标 | | | |
项目需要 | | | |
需要缩放 | | | |
不需要缩放 | | | |
控制存储设备 | | | |
本地访问 | | | |
全局访问 | | | |
按需计算和存储 | | | |
高运行时间和可靠性 | | | |
如何选择数据迁移工具
- 除了上述标准外,团队和组织在选择数据迁移解决方案时还会考虑其他因素。这些因素包括:
- 预算和日程表
- 团队的专业知识和经验
- 组织需要多大的规模和灵活性
- 与数据迁移工具提供商的关系
- 安全性和法规合规性
- 正常运行时间或其他 SLA
- 潜在影响
- 数据的用户
- 操作系统
如何开始云数据迁移
一旦组织准备好考虑数据迁移,他们可能就会开始探索其数据迁移工具或数据迁移合作伙伴的选择。若要了解迁移到 Azure 的好处和过程,请浏览以下资源:
有关数据迁移的常见问题解答
-
数据迁移是指数字信息的移动。将该信息传输到其他位置、文件格式、环境、存储系统、数据库、数据中心或应用程序,都符合数据迁移的定义。
-
数据迁移是指将数据从一个位置移动到另一个位置,而数据转换是指将数据从一种格式转换为另一种格式。数据转换有时会在数据迁移期间发生。
-
数据迁移类型可以分为五大类:存储迁移、数据库迁移、应用程序迁移、云迁移和业务流程迁移。