Azure 可靠性
取得所需的工具和訓練,放心設計和操作任務關鍵性系統。
可靠性是共同責任
從 Azure 雲端平台的彈性基礎開始,在所有工作負載上,達成組織的可靠性目標。放心設計和操作任務關鍵性應用程式,知道您可以信任雲端,因為 Azure 以公開透明為優先,讓您隨時掌握最新資訊,且能夠在服務問題期間快速採取行動。
如果您想最佳化 Azure 上現有的應用程式,請從 Azure Well-Architected Framework 開始,這是一組涵蓋五個核心要素的指導原則:可靠性、安全性、效能效率、成本最佳化和卓越營運。
從 Azure 基礎結構上可靠的基礎開始著手
閱讀 Azure 技術長暨技術夥伴 Mark Russinovich 的 Advancing Reliability 部落格系列,了解 Microsoft 為維護與改善雲端平台可靠性所進行的持續投資,這系列涵蓋四項最新主題,包括:透過智慧型軟體提高網路可靠性;利用 AIOps 確保開發安全 - Gandalf 簡介;大型分散式系統的復原威脅模型;以及低影響和沒有影響的維護。
Microsoft 網路連接超過 60 個 Azure 區域、200 個 Azure 資料中心、190 邊緣網站,超過 175,000 英哩的陸地和海底光纖遍及全球,在全球戰略邊緣網路節點銜接網際網路的其餘部分。請參閱此部落格文章 (分兩集),以深入了解 Microsoft 網路可靠性。
持續監視健康情況計量是部署流程的關鍵要素,也是 AIOps 扮演關鍵角色的層面。在這篇部落格文章中,您將了解 AI 與機器學習如何用來提升 DevOps 工程師的能力、大規模監視 Azure 部署流程、提前偵測到問題,以及根據影響範圍與嚴重性制定推出或復原決策。
了解 Azure 維修工程小組如何將「事後檢討」作為工具來了解發生什麼問題、發生問題的原因,以及中斷對客戶的影響,並取得事後檢討與復原威脅模型流程的見解。
了解 Azure 用以維護基礎結構的無影響和低影響更新技術,包括熱修補、記憶體保留維護和即時移轉,幾乎或完全不影響客戶或停機。
選擇符合您需求的正確 Azure 備援功能
了解哪些 Azure 高可用性、災害復原和備份功能可與您的應用程式搭配使用。另請了解如何選取適合您的計算、儲存體和地理 (本機、區域和地區) 備援選項。
啟用內建的復原能力
利用選用的 Azure 服務和功能,達成特定的可靠性目標。
可用性區域
在配備有獨立供電、冷卻系統及網路的資料中心之間執行重要工作負載。
可用性設定組
藉由共置或分隔資源,在資料中心內達到備援。
Azure 流量管理員
實作自動容錯移轉、將流量最佳化,以及結合內部部署和雲端系統。
Azure Site Recovery
將內部部署和 Azure 工作負載從主要站台複寫到次要位置。
Azure 備份
使用簡單、安全且符合成本效益的復原和還原解決方案備份資料。
Azure 儲存體
針對任何案例,使用備援選項建立和儲存多個資料複本。
監視雲端,避免成為黑箱
使用監視工具來識別、診斷和追蹤異常,以確保長期可靠性,並將可靠性和效能最佳化。
Azure Chaos Studio
讓發生的問題處於控制之下,有系統地改善復原能力。
Azure 服務健康狀態
發現資源問題,並使用可自訂的儀表板加以解決。
Azure 監視器
收集、分析來自 Azure 和內部部署環境的遙測資料,並據以採取行動。
Azure Application Insights
取得應用程式使用量的智慧型深入解析,並診斷異常狀況。
網路監看員
監視、診斷網路效能與健康狀態,並獲取深入解析。
Azure Advisor
利用以使用量遙測為基礎的建議,將應用程式和系統最佳化以取得可靠性。
文件、訓練與資源
Azure 架構中心
使用已建置的模式和最佳做法建置可靠的解決方案:
Microsoft Learn
利用這些免費的 Microsoft Learn 課程模組取得新技能,有助於讓您的應用程式和系統更可靠: