什么是机器学习？

什么是机器学习？它是如何工作的？

机器学习是 AI 的一个子集，它使用数学模型来帮助计算机从数据中学习，而无需给出直接指令。机器学习通过使用算法来识别模式，可创建进行预测的数据模型。随着收集和分析更多数据，预测会有所改进，就像人类从经验中学习的方式一样。这种适应性使得机器学习非常适合数据或任务不断变化的场景，在这些场景中，编码解决方案并不现实。

关键要点

机器学习是 AI 的一个子集，它允许计算机从数据中学习、识别模式并进行可随时间推移而改进的预测。
机器学习可帮助组织发现见解、改进数据挖掘、增强客户体验、预测客户行为、降低风险和削减成本。
机器学习技术包括监督式学习、非监督式学习、半监督式学习、强化学习、深度学习、迁移学习和集成学习。
各个行业都在使用机器学习，包括金融、医疗保健、运输、客户服务和农业。
机器学习过程涉及收集和准备数据、训练模型以及解释结果。
选择机器学习平台时，请关注云计算、易于访问的开发环境、支持熟悉的机器学习框架和企业级安全性等功能。

机器学习如何提供 ROI

发现见解

机器学习通过数据分析帮助识别结构化和非结构化数据中的模式或结构，从而发现可用于决策的可操作见解。它还改进了预测并随时间推移适应新的数据。

改进数据挖掘

机器学习非常适合涉及从大型数据集中提取有用信息的数据挖掘。它通过持续提升自身能力进一步提升这一优势，从而生成更准确的见解和优化的决策。

增强客户体验

自适应界面、针对性内容、聊天机器人和语音支持的虚拟助手都是机器学习如何帮助改善客户体验的示例。通过分析客户行为和偏好，机器学习可以个性化交互，提供及时和相关的信息，并简化客户服务。

降低风险

通过持续从新数据中学习，机器学习增强了检测和防止欺诈的能力，针对不断发展的威胁提供了可靠的保护。随着欺诈手段的发展，机器学习可通过检测新模式和防止欺诈得逞来实行新的情况。

预期客户行为

机器学习可挖掘与客户相关的数据，以识别模式和行为，从而帮助销售团队优化产品建议并在最大程度上提供最佳客户体验。通过从新的交互中持续学习，机器学习可以预测未来客户需求和偏好，以支持主动式和个性化互动。

降低成本

机器学习可通过自动执行重复和耗时的流程来降低成本，从而支持员工专注于更具战略性和更高价值的任务。此外，机器学习算法可通过分析大型数据集并确定可改进领域来优化资源分配并最大程度地减少效率低下的现象。这可为企业节省大量成本。

机器学习如何从数据中学习并做出预测或决策

监督式学习

使用带有标签或结构的数据集，让数据充当“教师”并“训练”机器学习模型，从而提高其进行预测或决策的能力。该模型通过将其预测与实际结果进行比较并相应地进行调整来学习，从而随时间推移提高准确度。

非监督式学习

使用不带任何标签或结构的数据集，将数据分组到群集中以识别模式和关系。此技术有助于发现数据中隐藏的结构，使其可用于客户细分和异常情况检测等任务。

半监督式学习

结合带标签和未标记的数据以进行训练。此技术尤其适用于标记数据成本高昂或耗费时间的情况。通过使用未标记数据，机器学习模型提高了其学习效率和准确度，促使半监督式学习成为适用于许多现实场景的实用技术。

强化学习

涉及取代人工操作员的代理（代表某人或某物执行操作的计算机程序）。代理可根据反馈循环确定结果，从反馈信号中学习，以随时间推移提高其性能。

深度学习

使用具有多个层的神经网络（称为深度神经网络）对数据中的复杂模式进行建模。此机器学习子集对于语音和图像识别特别有效，并且擅长处理大量数据和解决各种领域中的复杂问题。

迁移学习

在一个任务上进行预训练，然后在相关任务上进行微调。当新任务的数据有限时，此技术非常有用。通过使用初始任务中的知识，迁移学习可显著提高性能并减少新任务的训练时间。

集成学习

结合使用多个模型来提高整体性能。通过聚合多个模型的预测，集成学习可提高准确度和可靠性，其性能优于任何单个模型。

机器学习如何工作来解决问题

下面是机器学习过程的分步概述。

确定了数据源后，即可编译可用的数据。数据类型有助于确定应使用哪些机器学习算法。当数据科学家审阅数据时，会识别异常、开发结构并解决数据完整性问题。还执行数据预处理步骤，例如规范化、缩放和编码分类变量，以确保数据采用适合建模的格式。
准备好的数据Hi分为两组：训练集和测试集。训练集构成了数据的大部分，用于将机器学习模型优化到最高的准确度。
当数据科学家准备选择最终的数据模型时，测试集将用于评估模型的性能和准确度。计算准确度、精度、召回率和 F1 分数等指标以评估模型对未见数据的性能。
数据科学家会审核机器学习模型的结果，以提取见解、得出结论和进行预测。数据科学家客使用各种可视化工具和技术（如混淆矩阵）来解释和评估模型的性能。

主要功能

机器学习有什么作用？

预测值

机器学习通过标识变量之间的因果关系来预测值。回归算法可根据这些值创建模型，然后使用它们进行预测。回归研究有助于预测将来的情况，例如预测产品需求、预测销售数据或估计市场活动成果。

发现异常情况

异常检测算法可精确定位超出预期规范的数据，通常用于发现潜在风险。使用机器学习来解决这些问题的示例包括设备故障、结构缺陷、文本错误和欺诈事件。

查找结构

聚类分析算法通常是机器学习的第一步，可以揭示数据集中的基础结构。通过对常见项目进行分类，聚类分析在市场细分中广泛用于辅助定价和预测客户偏好。分类算法用于监督式学习，以分配可对信息进行准确分类的预定义标签。

机器学习工程师的角色

机器学习工程师可将从各种数据管道收集的原始数据转换为可缩放的数据科学模型。工程师会将结构化数据连接到数据科学家定义的模型。工程师还会开发算法并生成程序，以支持机器、计算机和机器人处理数据和识别模式。这包括选择和实现适当的算法、训练和评估模型，以及微调超参数来优化性能。

除了这些任务之外，机器学习工程师还会预处理数据，以使其适合建模、将模型部署到生产环境中，并持续监视和更新它们以保持准确度和有效性。通过与数据科学家密切合作，机器学习工程师消除了数据收集与可操作见解之间的差距，从而确保机器学习解决方案兼具实用性和影响力。

机器学习算法

机器学习算法通过数据分析来识别数据中的模式。它们通过预测值、识别异常事件、确定结构和创建类别来帮助数据科学家解决问题。算法的选择取决于数据类型和所需结果。算法通常按技术（监督式、非监督式或强化学习）或按功能（如分类、回归和聚类分析）进行分类。选择正确的算法对于有效应用机器学习至关重要。

详细了解机器学习算法。

跨行业的机器学习

各种行业中的企业均在使用机器学习来增强运营、改进决策制定并推动创新。下面是有关如何跨不同部门应用机器学习的一些关键示例。

银行和金融

风险管理和欺诈预防是机器学习为金融业创造巨大价值的关键领域。

医疗保健

机器学习帮助改进患者护理方面的示例包括改进诊断工具、支持实时患者监视和预测疾病爆发。

交通运输

机器学习通过识别交通异常、优化配送路线和支持自动驾驶车辆来实现交通运输行业的转型。

客户服务

回答问题、衡量客户意图和提供虚拟帮助是机器学习为客户服务行业提供支持的几个例子。

零售业

机器学习帮助零售商分析购买模式、优化套餐和定价，并使用数据改善总体客户体验。

农业

机器学习可通过开发机器人解决劳动力短缺问题、诊断植物病害以及监测土壤健康来改善农业生产。

机器学习平台应具备的功能

选择机器学习平台时，请寻找提供这些业务关键功能的解决方案。

云计算

借助轻松的设置和部署，云非常适合用于处理各种规模的工作负载，从而支持你连接数据源并根据需求进行缩放，而无需具备高级知识。

直观的开发环境

理想的平台支持各种技能级别。

对常见机器学习框架的内置支持

物色一个支持你使用自己熟悉和喜爱的工具来工作的平台，无论它是Open Neural Network Exchange (ONNX)、Python、PyTorch、scikit-learn 还是 TensorFlow。

企业级安全性

选择提供企业级治理、安全性和控制的平台来保护基础结构。

资源

详细了解机器学习

培养技能，开始使用 Azure 机器学习，并利用 Azure 资源。

Azure 机器学习

Azure 机器学习入门

了解详细信息

Azure 资源

浏览 Azure 资源中心

访问视频、分析师报告、培训、案例研究、代码示例和解决方案体系结构。

浏览资源

Microsoft Learn

Azure AI 学习中心

通过自定进度的学习计划、视频和文章构建 AI 和机器学习技能。

开始学习

机器学习的四个基础是数据收集、模型训练、模型评估和模型部署。数据收集包括收集和准备数据以供分析。模型训练使用此数据来指导算法进行预测或决策。模型评估使用准确度和精度等指标评估模型的性能。最后，模型部署涉及将训练后的模型集成到生产环境中，以便进行实时预测或决策。
机器学习中的正则化是一种用于防止过拟合的技术。当模型在训练数据上表现良好，但在新的未见数据上表现不佳时，将会发生这种情况。常见正则化方法包括 L1（套索）和 L2（岭）正则化，它们可对模型参数添加不同类型的惩罚项。这有助于提高模型对新数据的泛化能力，从而在实际应用中实现更好地性能。
它度量模型正确识别出的实际正例的比例。换言之，召回率回答以下问题："在所有正例中，模型正确预测了多少？"
机器学习模型的一个示例是决策树。决策树是一种监督式学习算法，用于分类和回归。它的工作原理是根据输入特征值将数据划分为子集，从而形成类似树的决策结构。树中的每个节点表示一个特征，每个分支表示一个决策规则，每个叶节点则表示一个结果。
决策树简单易懂，因此广泛应用于预测客户行为或诊断医疗条件等任务
机器学习是 AI 的子集。从本质上讲，AI 包含各种技术和方法，例如机器学习、自然语言处理和机器人。机器学习是用于实现 AI 的关键技术之一，它支持系统从经验中自动学习和适应，从而提升 AI 应用程序的有效性和智能程度。
机器学习是预测分析方面的关键技术，它使用历史数据来预测将来的事件。它通过识别数据中的模式和关系来增强此过程，从而实现更准确和可缩放的预测。机器学习模型针对历史数据进行训练，以了解基础模式，并可应用于新数据来预测结果。通过持续的学习，这些模型可提高预测准确度，从而实现更有效的预测分析。
机器学习涵盖各种用于从数据中学习的算法和技术，深度学习则特别侧重于使用这些深度神经网络在图像和语音识别等任务中实现高性能。所有的深度学习都是机器学习的子集，但并非所有机器都包括深度学习。