略過導覽

即時資料流中的異常偵測

Cortana Intelligence IT 異常深入解析解決方案可協助大型組織的 IT 部門根據基礎健康狀態計量,以自動化且可調整規模的方式快速偵測並修正問題,這些計量包括 IT基礎結構 (CPU、記憶體等)、服務 (逾時、SLA 變化、限制用電等),以及其他關鍵效能指標 (KPI) (未完成訂單、登入和付款失敗等)。此解決方案也提供簡單的「立即試用」體驗,可嘗試使用自訂資料來實現解決方案所提供的價值。「部署」體驗將端對端解決方案元件部署到您的 Azure 訂用帳戶,並視需要提供完整的自訂控制權,讓您快速在 Azure 上開始使用解決方案。

說明

注意:若您已部署了此解決方案,按一下這裡即可檢視部署。

與我們的進階分析合作夥伴之一連絡,以安排您環境中的概念證明:Neal AnalyticsEmpired

預估佈建時間:30 分鐘

今日,現代化服務會產生大量遙測資料,以追蹤操作健康狀態、系統效能、使用情況的深入解析、商務指標、警示等等各種層面。不過,監視及收集此大量資料的深入解析對於 IT 部門而言通常不是完全自動的,而且可能很容易發生錯誤 (通常使用規則或閾值型警示),因此很難有效且正確地判斷系統在任何指定時間點的健康狀態。

Cortana Intelligence IT 異常深入解析解決了這道客戶難題,它在提供以 Cortana Intelligence 解決方案 (輕鬆部署 Azure 服務) 和 Azure Machine Learning 異常偵測 API (完全自動化歷程記錄和即時資料的追蹤) 為基礎的解決方案時降低進入門檻,讓業務決策者輕鬆就能在幾分鐘內就評估並實現價值,同時讓客戶可以攜帶自己的資料、自訂及擴充解決方案,以根據其特定情況透過快速概念證明進行調整。透過此解決方案,組織將能夠:

  • 利用最新 Azure Machine Learning 異常偵測 API,從歷程記錄和即時資料了解異常並做出回應。這排除了重新校準閥值以偵測遺漏的異常及減少誤判所需的人機互動 (Human-in-the-loop)。
  • 不需要預先投資,就能試用自己的資料,因此可快速實現解決方案的潛力。「立即試用」體驗也可讓使用者決定適用於手邊使用案例的敏感度參數設定。
  • 在其訂用帳戶中部署端對端管線,只要幾分鐘就能以隨插即用的方式,從內部部署和雲端資料來源擷取資料,並向下游監視和票證系統回報異常事件。

PowerBI 的試用體驗

預先設定 IT 異常深入解析的解決方案儀表板

解決方案圖表

請參閱 GitHub 上的方案架構和詳細指示。

如下面解決方案圖表所示,來自內部部署或雲端式系統的即時計量資料流會送入 Azure 事件中樞佇列。Azure 串流分析會處理這些事件 (或時間序列資料點),每五分鐘彙總一次。每 15 分鐘會將每個時間序列送到 Azure 異常偵測 API 進行評估。API 的結果及輸入期間所提供的維度會儲存到 Azure SQL DB 中。偵測到的異常也會在 Azure 服務匯流排中發佈,以供下游票證系統取用。解決方案也提供設定 Power BI 儀表板的指示來快速將這些異常視覺化,以便進行根本原因分析。

異常偵測 API

「立即試用」體驗和已部署的解決方案中都會用到異常偵測 API。其有助於偵測您的時間序列資料中不同的異常模式類型。它會對時間序列中的每個資料點指派一個異常分數,以用於產生警示、透過儀表板監視或與票證系統連接。異常偵測 API 可以偵測時間序列資料中的下列異常類型:

  • 突然增加和突然減少:例如,監視某項服務的登入失敗次數或某個電子商務網站的結帳次數時,不尋常的突然增加或突然減少可能表示安全性攻擊或服務中斷。
  • 正面和負面趨勢:例如,監視運算中的記憶體使用量時,減少的可用記憶體大小可能表示記憶體流失;監視服務佇列長度時,持續向上走勢可能表示基本軟體問題。
  • 層級變更和數值的動態範圍變更:例如,服務升級後的服務延遲層級變更或升級後的例外狀況等級降低,都是值得監視的重點。

免責聲明

© 2017 Microsoft Corporation.著作權所有,並保留一切權利。這項資訊依照「現況」提供,且可能變更而不另行通知。Microsoft 對於此處提供的資訊不提供任何明示或默示的擔保。產生此解決方案的過程中使用了協力廠商的資料。您必須尊重他人的權利,包括取得及遵從相關授權以建立相似的資料集。

相關解決方案架構

預測性維護

此預測性維護解決方案可監視飛機,並預測飛機引擎零件的剩餘使用年限。

品質保證

品質保證系統可讓企業預防在商品或服務遞送給消費者的過程中出現缺失。建置此類沿管線收集資料及識別可能問題的系統,可獲得莫大好處。例如,在數位製造業中,保證整條裝配線的品質勢在必行。在延遲與可能失敗發生前即找出它們,而不是在偵測到問題後才找出它們,可協助業者降低處理廢品和重做的費用,同時提高生產力。