跳过导航

预测性维护

了解如何使用 AI 预测和预防故障以及最大限度提高有效服务寿命

简介

计划外设备停机对任何企业而言都极具破坏性。保持现场设备运行以最大限度提高利用率,以及将昂贵的计划外停机、运行不正常风险、安全性风险和环境风险降至最低,这一点非常重要。预测性维护策略的目标是延长设备的有效使用寿命并预防故障。异常诊断是一种常见方式,因为它可识别设备的非预期行为。异常检测解决方案通常比基于简单规则的故障检查方法更加准确,对预防代价昂贵的故障和服务中断很有帮助。

准备数据

预测性维护解决方案的第一步是准备数据。这包括数据引入、清理和特征工程。预测性维护问题通常包含以下数据:

  • 机器信息(例如引擎大小、型号和模型)
  • 遥测数据(例如温度、压力、振动、液体属性和操作速度等传感器数据)
  • 维护和干预历史记录:机器维修历史记录和运行时日志
  • 故障历史记录:相关机器或组件的故障历史记录。

数据必须同时包含成功和失败示例方可预测故障。示例越多,预测性维护模型越佳,越具有概括性。同时还需注意,应具有已发生故障和仍在运行的设备的相关数据。数据可能包含因所关注的特定问题而产生故障的设备的读数,以及因其他原因而产生故障的设备的数据。在这两种情况下,拥有的数据越多,产生的解决方案越好。

构建和定型

许多预测性维护解决方案使用多类分类模型计算资产的剩余使用寿命。需要预测两个结果时使用多类分类预测性维护;即,预测故障的时间范围和由某一根本原因而产生故障的概率。除选择正确的算法外,构建成功的模型还需要恰当优化的超参数。此类参数是在定型过程开始前设置的,如神经网络中的层数。超参数统称由数据科学家通过反复试错方式进行指定。这些超参数影响模型的准确性和性能,并且找到最佳值通常需要不断反复。

每次定型运行操作会生成用于评估模型有效性的指标。尽管在预测性维护解决方案中通常使用召回率和 F1 分数,但是准确性是用于描述分类器性能的最常见指标。精度是故障预测实例的 TP 数相较于 TP 数和 FP 数之和的比率,而召回率表示故障预测实例的 TP 数相较于 TP 数和 FN 数之和的比率。F1 分数同时考虑精度和召回率。

部署

标识模型的最有效变体后,需将该模型部署为具有 REST 终结点的 Web 服务。然后业务线应用程序或分析软件会调用该模型。然而,在预测性维护情况下,端到端架构通常涉及机器的实时遥测数据(由 Azure 事件中心等系统收集)。此数据由流分析引入并进行实时处理。处理后的数据传递到预测性模型 Web 服务,结果显示在仪表板上或发送到可告知技师或服务人员问题的警报机制。引入的数据还可能存储在历史数据库(例如本地数据库)中并与外部数据合并,从而使数据可发回到用于建模的定型模型。物联网 (IoT) 方案可能会将模型部署到边缘,以便检测可在时间和空间上尽可能接近事件的情况下发生。

客户正在使用 AI 创造佳绩