Azure

Azure の信頼性

ミッションクリティカルなシステムの設計と運用を自信を持って行うために必要なツールとトレーニングを入手しましょう。

信頼性は共有責任です

Azure クラウドプラットフォームの回復性のある基盤から開始することで、お客様のすべてのワークロードに対する組織の信頼性の目標を達成することができます。お客様のミッションクリティカルなアプリケーションを自信を持って設計および運用することができます。また、Azure は透明性を重視しているため、お客様はご自分のクラウドを信頼できます。そして、サービスの問題が発生しても常に情報を把握し、迅速に対応することができます。
既存のアプリケーションを Azure 上で最適化するためには、信頼性、セキュリティ、パフォーマンス効率、コスト最適化、オペレーショナルエクセレンスという 5 つの原則の柱からなる Azure Well-Architected フレームワークを利用して開始することをおすすめします。

Azure クラウドプラットフォームの信頼性 + 必要に応じて回復機能を使用 = 高い信頼性と回復性があるアプリを実現する方法を示す図

Azure インフラストラクチャ上の信頼性の高い基盤から開始する

クラウドプラットフォームの信頼性を維持および向上させるために行われている Microsoft の投資について、Azure CTO 兼テクニカルフェローの Mark Russinovich がブログシリーズ「Advancing Reliability」で、以下に挙げる 4 つの最新トピックを詳しくご紹介します。「インテリジェントなソフトウェアによるネットワークの信頼性」、「AIOps による安全な開発 - Gandalf の概要」、「大規模な分散システムにおける回復性の脅威モデリング」、「影響の少ない、または影響のまったくないメンテナンス」。

インテリジェントなソフトウェアによるネットワークの信頼性 AIOps による安全なデプロイ — Gandalf の概要大規模な分散システムにおける回復性の脅威モデリング影響の少ない、またはまったくないメンテナンス

Microsoft ネットワークは、60 個以上の Azure リージョン、300 箇所以上の Azure データセンター、190 個のエッジサイト、および世界中で 175,000 マイル以上の陸上および海底ファイバーを接続しています。

正常性メトリクスの継続的な監視は、デプロイプロセスの基本です。これには、AIOps が重要な役割を果たします。このブログ記事では、AI と機械学習を使用して DevOps エンジニアを支援し、Azure のデプロイプロセスを大規模に監視し、問題を早期に検出し、影響の範囲と重大度に基づいてロールアウトまたはロールバックを決定する方法について説明しています。

Azure サービスエンジニアリングチームが、"事後検証" をツールとして使用して、どのようにして問題の内容、問題の発生過程、サービス停止の顧客への影響の理解を深め、どのようにして分析情報を事後検証と回復性の脅威モデリングプロセスに取り入れるかについて説明します。

Azure がインフラストラクチャを保守するために使用している、お客様への影響やダウンタイムがほとんどない、またはまったくない、ホットパッチの適用、メモリ保持メンテナンス、ライブ移行など、影響のまったくない、または影響の少ない更新テクノロジについて詳しくご確認ください。

自分のニーズに合う適切な Azure 回復性機能を選択する

お使いのアプリで使用できる Azure の高可用性、ディザスターリカバリー、バックアップの機能をご覧ください。また、お客様にとって最適なコンピューティング、ストレージ、地理的 (ローカル、ゾーン、リージョン) の冗長性オプションを選択する方法についてもご確認ください。

PDF のダウンロード

各種 Azure サービスがどのように異なる回復性機能を提供しているかを示すインフォグラフィック PDF

組み込みの回復性を有効にする

オプションの Azure サービスと機能を活用すれば、お客様固有の信頼性の目標を達成することができます。

可用性ゾーン

独立した電源、冷却装置、ネットワークを備えた複数のデータセンター間で重要なワークロードを実行できます。

可用性セット

リソースを併置または分離することで、データセンター内の冗長性を達成できます。

Azure Traffic Manager

自動フェールオーバーを実装し、トラフィックを最適化し、オンプレミスとクラウドのシステムを組み合わせることができます。

Azure Site Recovery

オンプレミスと Azure のワークロードをプライマリサイトからセカンダリサイトにレプリケートできます。

Azure Backup

シンプルで安全、そしてコスト効率の高い回復および復元ソリューションでデータをバックアップできます。

Azure Storage

あらゆるシナリオに対応する冗長性オプションを使用して、データの複数のコピーを作成して保存することができます。

ブラックボックス化しないようにクラウドを監視する

監視ツールを使用して長期的な信頼性を確保し、異常を特定、診断、追跡することで、信頼性とパフォーマンスを最適化することができます。

Azure Chaos Studio

混乱をコントロールすることによって、回復力を体系的に向上させます。

Azure Service Health

カスタマイズ可能なダッシュボードを使用して、リソースの問題を特定し、それを解決することができます。

Azure Monitor

Azure とオンプレミス環境からテレメトリデータを収集、分析し、それに基づいて行動を起こすことができます。

Azure Application Insights

アプリの使用状況についてのインテリジェントな分析情報を取得し、異常を診断できます。

Network Watcher

ネットワークのパフォーマンスと正常性を監視、診断し、分析情報を取得できます。

Azure Advisor

使用状況のテレメトリに基づく推奨事項を使用して、アプリとシステムを最適化し、信頼性を高めることができます。

あらゆる規模の組織によって信頼されている信頼性

マイアミ大学は Microsoft Azure を使って信頼性を高めています

"ソリューションを考えるときはいつでも、「オンプレミスではなくクラウドでこれを行うにはどうすればよいか?」と考えます。これにより私たちの回復性が高まるだけでなく、柔軟性と敏捷性も高まります。"

マイアミ大学、クラウドインフラストラクチャサービス、IT ディレクター、Mari Lovo 氏

事例を読む

Marie Curie では、より安定した信頼性のあるサービスを提供しています

"ここ 2 年半で、クラウドインフラストラクチャの障害による停止が 1 回ありました。ほぼ瞬時に安定性と一息付ける時間が得られ、組織に真の価値をもたらすことに集中できるようになりました。"

Marie Curie、IT ディレクター、Ivan Delany 氏

ビデオを見る

Juvare では、インシデントプラットフォームの信頼性と整合性を促進しています

"ワークロードをさまざまな可用性ゾーンとリージョンに分散させ、地理的なデータ所在地に関するクライアントの要件を維持するだけでなく、インフラストラクチャの特定の部分に問題が発生した場合に影響範囲を縮小できるようにソリューションを設計しました。"

Juvare、最高情報責任者、Bryan Kaplan 氏

ビデオを見る

GEP では、ロジスティックプラットフォームの信頼性を向上させました

"当社では AKS (Azure Kubernetes Service) の組み込みノードプールを使用しています。たとえば、プライマリノードプールがダウンしていると、クラスター内で 2 番目の可用性ゾーンに自動的にフェールオーバーできます。"

GEP、プリンシパルエンジニア、Nithin Prasad 氏

ビデオを見る

ドキュメント、トレーニング、リソース

Azure アーキテクチャセンター

確立されたパターンとベストプラクティスを使用して、信頼性の高いソリューションを構築できます。

Azure Well-Architected フレームワーク Azure Well-Architected レビュー Azure アプリケーションアーキテクチャガイドクラウドの設計パターン

Microsoft Learn

これらの無料の Microsoft Learn モジュールを使用して、アプリやシステムの信頼性を高めるための新しいスキルを身につけましょう。

Microsoft Azure Well-Architected フレームワークを使用して優れたソリューションを構築する Azure での移行、事業継続、ディザスターリカバリーの設計 Azure リソースの監視とバックアップ

サイト信頼性エンジニアリング (SRE)

SRE の使用方法をご確認ください。これは、組織がシステム、サービス、製品の適切なレベルの信頼性を達成するために役立つ規範です。

SRE のドキュメントビデオ: サイト信頼性エンジニアリングの概要学習モジュール: サイト信頼性エンジニアリングの概要

Azure Well-Architected フレームワークの優れたアーキテクチャの 5 つの柱の 1 つである信頼性のためのアーキテクチャについて詳しくご確認ください