預測性維護

了解如何使用 AI 預測及預防失敗,並延長服務使用年限

簡介

對所有企業來說,設備在非排程的時間停機都會造成不利影響。讓現場設備保持運作以達到最大使用率、將代價高昂的非排程停機時間、以及健康狀態、安全和環境風險降到最低都相當重要。預測性維護策略的目標是延長設備的服務使用年限,並且避免失敗。異常偵測是常見的方法,因為它可偵測到裝置行為與預期不同的現象。異常偵測解決方案通常比以失敗偵測方法為基礎的簡易規則更準確,而且在嘗試避免代價很高的失敗和中斷時很實用。

準備資料

預測性維護解決方案中的第一個步驟是準備資料。這包括資料擷取、清理和特徵工程。預測性維護問題通常包含下列資料:

  • 電腦資訊 (例如引擎大小、廠牌和機型)
  • 遙測資料 (例如溫度、壓力、震動、流體性質和運作速度等感應器資料)
  • 維護和介入歷程記錄:機器的維修歷程記錄和執行階段記錄
  • 故障記錄:相關機器或元件的故障記錄。

若要預測失敗,資料必須同時包含成功與失敗的範例。擁有大量範例可產生更佳且更一般化的預測性維護模型。而擁有已失敗裝置和正在運作之裝置的資料也相當重要。資料可能包含因您所關心之特定問題而故障的設備,或來自由於其他原因而故障之裝置的讀數。在這兩種情況下,資料越多,解決方案越佳。

建置和定型

許多預測性維護解決方案使用多類別分類模型,來計算資產的剩餘使用年限。當您想要預測兩個結果時,可使用多類別分類預測性維護;即為失敗的時間範圍,以及由於多個根本原因之一所造成的失敗可能性。除了選擇正確的演算法之外,成功的模型還需要經過適當調整的超參數。這些是定型程序開始之前設定的參數,例如類神經網路層數。超參數通常由資料科學家以反覆試驗的方式來指定。它們會影響模型的正確性和效能,而且通常可能需要反覆運算多次才能找到最佳值。

每個定型執行都會產生用於評估模型有效性的計量。正確性是最常用的計量,用於描述分類器的效能,但在預測性維護解決方案中,通常會使用重新叫用和 F1 分數。精確度會定義為真肯定數目 / (真肯定數目 + 誤判數目),而重新叫用是指真肯定數目 / (真肯定數目 + 失敗預測執行個體的誤判數目)。F1 分數會視為精確度與重新叫用比率。

部署

找出最有效的模型版本之後,該模型必須部署為具有 REST 端點的 Web 服務。該模型隨後會由企業營運應用程式或分析軟體呼叫。不過,在預測性維護案例中,端對端架構通常需要機器的即時遙測資料,這會交由 Azure 事件中樞等系統進行收集。該資料會由串流分析擷取並即時處理。處理後的資料會傳遞至預測性模型 Web 服務,而結果會顯示在儀表板上,或饋送至警示機制,以通知技術人員或服務人員發生問題。擷取的資料也可儲存在歷史資料庫中,並與內部部署資料庫等外部資料合併,以饋送回到模型的定型範例中。物聯網 (IoT) 案例也能讓模型部署至 Edge,使偵測發生的時空能趨近於事件發生的時空。

客戶運用 AI 的成就斐然