略過導覽

Azure 可靠性

取得所需的工具和訓練,信心十足設計和操作任務關鍵性系統

可靠性是共同責任

從 Azure 雲端平台的彈性基礎開始,在所有工作負載上,達成組織的可靠性目標。信心十足設計和操作任務關鍵性應用程式,知道您可以信任雲端,因為 Azure 以公開透明為優先,讓您隨時掌握最新資訊,且能夠在服務問題期間快速採取行動。

如果您想最佳化 Azure 上現有的應用程式,請從 Azure Well-Architected Framework 開始,這是一組涵蓋五個核心要素的指導原則: 可靠性、安全性、效能效率、成本最佳化和卓越營運。

從 Azure 基礎結構上可靠的基礎開始著手

閱讀 Azure 技術長暨技術夥伴 Mark Russinovich 的 Advancing Reliability 部落格系列,了解 Microsoft 為維護與改善雲端平台可靠性所進行的持續投資,這系列涵蓋四項最新主題,包括: 透過智慧型軟體強化網路可靠性; 利用 AIOps 確保開發安全 - Gandalf 簡介; 大型分散式系統的復原威脅模型;以及極低或完全沒影響的維護。

Microsoft 網路連線了全球超過 60 個 Azure 區域、200 個 Azure 資料中心、190 個邊緣網站,以及超過 175,000 英哩的陸地和海底光纖,這些光纖在全球戰略邊緣網路節點銜接網際網路的其餘部分。請參閱此部落格文章 (分兩集),以深入了解 Microsoft 網路可靠性。

持續監視健康情況計量是部署程序的關鍵要素,也是 AIOps 扮演關鍵角色的層面。在本部落格文章中,您將了解 AI 與機器學習如何用來提升 DevOps 工程師的能力、大規模監視 Azure 部署程序、提前偵測到問題,以及根據影響範圍與嚴重性進行推出或復原。

了解 Azure 維修工程小組如何將「事後檢討」作為工具來了解發生什麼問題、發生問題的原因,以及中斷對客戶的影響,並取得事後檢討與復原威脅模型程序的見解。

了解 Azure 用以維護基礎結構的無影響和低影響更新技術,包括熱修補、記憶體保留維護和即時移轉,幾乎或完全不影響客戶或停機

選擇符合您需求的正確 Azure 備援功能

了解哪些 Azure 高可用性、災害復原和備份功能可與您的應用程式搭配使用。另請了解如何選取適合您的計算、儲存體和地理 (本機、區域和地區) 備援選項。

圖表 PDF,顯示不同的 Azure 服務如何提供不同的復原功能

啟用內建的復原能力

利用選用的 Azure 服務和功能,達成特定的可靠性目標。

可用性區域

在配備有獨立供電、冷卻系統及網路的資料中心之間執行重要工作負載。

可用性設定組

藉由共置或分隔資源,在資料中心內達到備援。

Azure 流量管理員

實作自動容錯移轉、將流量最佳化,以及結合內部部署和雲端系統。

Azure Site Recovery

將內部部署和 Azure 工作負載從主要網站複寫到次要位置。

Azure 備份

使用簡單、安全且符合成本效益的復原和還原解決方案備份資料。

Azure 儲存體

針對任何案例,使用備援選項建立和儲存多個資料複本。

監視雲端,避免成為黑箱

使用監視工具來識別、診斷和追蹤異常,以確保長期可靠性,並將可靠性和效能最佳化。

Azure Chaos Studio

讓發生的問題處於控制之下,有系統地改善復原能力。

Azure 服務健康狀態

發現資源問題,並使用可自訂的儀表板加以解決。

Azure 監視器

收集、分析來自 Azure 和內部部署環境的遙測資料,並據以採取行動。

Azure Application Insights

取得應用程式使用量的智慧型深入解析,並診斷異常狀況。

網路監看員

監視、診斷網路效能與健康狀態,並獲取深入解析。

Azure Advisor

利用以使用量遙測為基礎的建議,將應用程式和系統最佳化以取得可靠性。

值得各種規模組織信任的可靠性

ClearBank 打造了基礎結構復原能力、客戶信任和競爭價值

"Ensuring end-to-end reliability and resiliency is a team effort. We get the tools from Azure, and we set up the systems and processes to put it all together."

ClearBank 技術長 Tom Harris
ClearBank

Kodak Alaris 改善 ERP 復原能力來提高生產力

"The one thing I don't want is my CIO coming to me because there's a problem with our ERP. The truth is, it never happens anymore—it's a real testament to our ERP's reliability in Azure."

– Kodak Alaris IT 營運經理 Joseph Calabrese
Kodak Alaris

邁阿密大學使用 Microsoft Azure 提高可靠性

"Whenever we think of a solution, we think, 'How can we do this in the cloud versus on-premises?' It not only makes us more resilient, but more flexible and nimble as well."

Mari Lovo,主管,雲端基礎結構,邁阿密大學
University of Miami

Marie Curie 提供更穩定、可靠的服務

"In the last two and a half years, we've had one outage which has been due to cloud infrastructure failing. It just almost instantly gave us stability, space to breathe, enabled us to focus on bringing real value to the organization."

Marie Curie IT 總監 Ivan Delany
Marie Curie

Juvare 驅動其事件平台的可靠性和完整性

"We architected our solution to spread workloads across different availability zones and regions, to maintain both client requirements for geographic data residency but also to ensure that if one particular part of our infrastructure was having a problem, it reduced the blast radius."

Juvare 資訊長 Bryan Kaplan
Juvare

GEP 改善了其物流平台的可靠性

"We use AKS or Azure Kubernetes Service inbuilt node pools...say your primary node pool is down, within the cluster you're automatically able to failover to the second availability zone."

GEP 首席工程師 Nithin Prasad
gep

文件、訓練與資源

Azure Architecture Center

使用已建置的模式和最佳做法建置可靠的解決方案:

Microsoft Learn

利用這些免費的 Microsoft Learn 課程模組取得新技能,有助於讓您的應用程式和系統更可靠:

網站可靠性工程 (SRE)

了解如何使用 SRE,這是一項專業領域,可協助組織在其系統、服務和產品中達到適當的可靠性等級:

深入了解如何建構可靠性,這是 Azure Well-Architected Framework 中的五大卓越架構要素之一

深入了解