Trace Id is missing
メイン コンテンツにスキップ

Microsoft Xbox チームは、ゲーム ストリーミング サービスを構築するために SRE ロールを採用

グローバルに分散された Kubernetes デプロイを設計するさいに、運用チームと開発者がどのように信頼できるパートナーとなったかについてご覧ください。

課題:グローバル スケールのプロセスの作成

多くの運用チームと同じように、Xbox 信頼性エンジニアリングおよび運用 (xREO) チームも、データ センターの保守、新しいコードのデプロイ、自分たちで設計したのではないモノリシックで柔軟性に欠けるアーキテクチャを使うことで生じる問題への対処という、単調な手作業に多くの時間を使っていました。40 を超える国と地域にまたがる何百万というアクティブな月間サブスクライバーのためのサービスを維持できていたのはチームの努力によるものでしたが、世界中のゲーマーを対象とする低待機時間の要件がきわめて厳しい、 プロジェクト xCloud ゲーム ストリーミング エクスペリエンスをサポートすることになったとき、それまでのサービス エンジニアリング ロールの枠を越え、チーム間のサイロを壊し、作業方法を新たに作り直すことが必要になりました。

会議室で話をしている人

課題:クラウド運用モデルへの適応

"小さな変更でも重大なリスクが生じ、対応に多くの時間を費やしました。運用モードはほとんど事後対応型であり、それほど多くのことを行うことができませんでした。"

Xbox 信頼性および運用担当、SRE PM、James Whitesides

コラボレーションと自動化による、スケーリングの解決

プロジェクトの初期段階に、開発チームは、Azure のグローバル リーチを活用する新しいアーキテクチャを設計して構築するには、xREO の協力が必要であることを認識しました。サービス コードをインフラストラクチャから分離するためのコンテナーと、オーケストレーションのための当然の選択としての Kubernetes にまず着手したチームは、管理の複雑さを大幅に軽減するために、フル マネージドの Azure Kubernetes Service (AKS) を選択しました。

この合理的なシステムを選択したものの、xREO チームはそれぞれの Kubernetes クラスターを構築するために必要な手作業にすぐに圧倒されました。繰り返しと自動化のために、チームは、リソースを迅速にプロビジョニングするための Azure Resource Manager テンプレートを使用して、Azure Pipelines により継続的インテグレーションと継続的デリバリー (CI/CD) のパイプラインを構築することに決めました。

課題:クラウド運用モデルへの適応

"SRE ロールでは、開発者と共にプラットフォームを構築します。私たちはデプロイ プロセスの一部です。チェックリストをバーンダウンするのではなく、構築と改善に重点を置いています。"

Xbox 信頼性および運用担当、SRE PM、James Whitesides

新しいミッションにおいて新しいロールを引き受ける

現在、CI/CD パイプラインは、(リージョンごとに) 100 を超えるリソースに依存する 35 を超える AKS ベースのマイクロサービスを多数の Azure リージョンにデプロイしており、この数は今後も増加します。新しいリージョンにデプロイするために、チームは 6 行のコードを追加し、リソースが動き出すのを待ちます。

デプロイが完全に自動化されたため、xREO チームはサイト信頼性エンジニアリング (SRE) ロールに移行し、問題の修正ではなく新しいツールの作成にほとんどの時間を費やすことができるようになりました。チームは信頼できるパートナーとして開発チームからよく相談を受けます。チームは、プロアクティブで高価値の、実りの多い仕事に没頭しています。