Trace Id is missing
跳至主要內容

Azure 可靠性

取得所需的工具和訓練,放心設計和操作任務關鍵性系統。

可靠性是共同責任

從 Azure 雲端平台的彈性基礎開始,在所有工作負載上,達成組織的可靠性目標。放心設計和操作任務關鍵性應用程式,知道您可以信任雲端,因為 Azure 以公開透明為優先,讓您隨時掌握最新資訊,且能夠在服務問題期間快速採取行動。 
 如果您想最佳化 Azure 上現有的應用程式,請從 Azure Well-Architected Framework 開始,這是一組涵蓋五個核心要素的指導原則:可靠性、安全性、效能效率、成本最佳化和卓越營運。

圖表顯示 Azure 雲端平台可靠性 + 視需要使用復原功能如何 = 實現高度可靠的復原性應用程式

從 Azure 基礎結構上可靠的基礎開始著手

閱讀 Azure 技術長暨技術夥伴 Mark Russinovich 的 Advancing Reliability 部落格系列,了解 Microsoft 為維護與改善雲端平台可靠性所進行的持續投資,這系列涵蓋四項最新主題,包括:透過智慧型軟體提高網路可靠性;利用 AIOps 確保開發安全 - Gandalf 簡介;大型分散式系統的復原威脅模型;以及低影響和沒有影響的維護。

Microsoft 網路連接超過 60 個 Azure 區域、200 個 Azure 資料中心、190 邊緣網站,超過 175,000 英哩的陸地和海底光纖遍及全球,在全球戰略邊緣網路節點銜接網際網路的其餘部分。請參閱此部落格文章 (分兩集),以深入了解 Microsoft 網路可靠性。

持續監視健康情況計量是部署流程的關鍵要素,也是 AIOps 扮演關鍵角色的層面。在這篇部落格文章中,您將了解 AI 與機器學習如何用來提升 DevOps 工程師的能力、大規模監視 Azure 部署流程、提前偵測到問題,以及根據影響範圍與嚴重性制定推出或復原決策。

了解 Azure 維修工程小組如何將「事後檢討」作為工具來了解發生什麼問題、發生問題的原因,以及中斷對客戶的影響,並取得事後檢討與復原威脅模型流程的見解。

了解 Azure 用以維護基礎結構的無影響和低影響更新技術,包括熱修補、記憶體保留維護和即時移轉,幾乎或完全不影響客戶或停機

返回索引標籤

選擇符合您需求的正確 Azure 備援功能

了解哪些 Azure 高可用性、災害復原和備份功能可與您的應用程式搭配使用。另請了解如何選取適合您的計算、儲存體和地理 (本機、區域和地區) 備援選項。

資訊圖 PDF,顯示不同的 Azure 服務如何提供不同的復原功能

啟用內建的復原能力

利用選用的 Azure 服務和功能,達成特定的可靠性目標。

可用性區域

在配備有獨立供電、冷卻系統及網路的資料中心之間執行重要工作負載。

可用性設定組

藉由共置或分隔資源,在資料中心內達到備援。

Azure 流量管理員

實作自動容錯移轉、將流量最佳化,以及結合內部部署和雲端系統。

Azure Site Recovery

將內部部署和 Azure 工作負載從主要站台複寫到次要位置。

Azure 備份

使用簡單、安全且符合成本效益的復原和還原解決方案備份資料。

Azure 儲存體

針對任何案例,使用備援選項建立和儲存多個資料複本。

監視雲端,避免成為黑箱

使用監視工具來識別、診斷和追蹤異常,以確保長期可靠性,並將可靠性和效能最佳化。

Azure Chaos Studio

讓發生的問題處於控制之下,有系統地改善復原能力。

Azure 服務健康狀態

發現資源問題,並使用可自訂的儀表板加以解決。

Azure 監視器

收集、分析來自 Azure 和內部部署環境的遙測資料,並據以採取行動。

Azure Application Insights

取得應用程式使用量的智慧型深入解析,並診斷異常狀況。

網路監看員

監視、診斷網路效能與健康狀態,並獲取深入解析。

Azure Advisor

利用以使用量遙測為基礎的建議,將應用程式和系統最佳化以取得可靠性。

值得各種規模組織信任的可靠性

ClearBank 打造了基礎結構復原能力、客戶信任和競爭價值

「確保端對端可靠性與復原能力需要團隊共同努力。我們從 Azure 取得工具,並設定系統和流程,將一切結合在一起。」

ClearBank 技術長 Tom Harris

Clear Bank

邁阿密大學使用 Microsoft Azure 提高可靠性

「每當我們思考解決方案時,都會思考『如何在雲端或內部部署環境中執行這項作業?』 這不僅讓我們更具復原能力,也更具彈性與靈活性。」

邁阿密大學雲端基礎結構服務 IT 總監 Mari Lovo

邁阿密大學

Marie Curie 提供更穩定、可靠的服務

「過去兩年半來,我們發生過一次由於雲端基礎結構失敗所造成的中斷。它幾乎立即提供我們穩定性和一個呼吸的空間,讓我們得以專注於為組織帶來真正的價值。」

Marie Curie IT 總監 Ivan Delany

Marie Curie

Juvare 提升事件平台的可靠性和完整性

「我們所建構的解決方案將工作負載分散到不同的可用性區域和地區,不僅維護客戶對地理資料落地的需求,並確保在基礎結構的某個特定部分發生問題時,能夠縮小影響範圍。」 

Juvare 資訊長 Bryan Kaplan

Juvare

GEP 改善了其物流平台的可靠性

「我們使用 AKS (或 Azure Kubernetes Service) 內建節點集區...因此如果主要節點集區無法使用,還能自動容錯移轉到叢集中的次要可用性區域。」 

GEP 首席工程師 Nithin Prasad

GEP
返回索引標籤

文件、訓練與資源

Azure 架構中心

使用已建置的模式和最佳做法建置可靠的解決方案:

Microsoft Learn

利用這些免費的 Microsoft Learn 課程模組取得新技能,有助於讓您的應用程式和系統更可靠:

網站可靠性工程 (SRE)

了解如何使用 SRE,這個專業領域協助組織在其系統、服務和產品中達到適當的可靠性等級:

深入了解如何建構可靠性,這是 Azure Well-Architected Framework 中的五大卓越架構要素之一