Trace Id is missing
Lompat ke konten utama

Tim Microsoft Xbox mengadopsi peran SRE untuk membangun streaming game

Lihat bagaimana tim operasi dan pengembang menjadi mitra tepercaya untuk merancang penyebaran Kubernetes yang didistribusikan secara global.

Tantangan: Membuat proses untuk skala global

Seperti banyak tim operasi, tim Operasi dan Rekayasa Keandalan Xbox (xREO) biasanya menghabiskan banyak waktu untuk melakukan tugas manual dan berulang untuk mengelola pusat data, menyebarkan kode baru, dan menanggapi masalah yang timbul dari bekerja di dalam arsitektur yang monolitik dan kaku yang tidak mereka rancang sendiri. Upaya mereka telah membuat layanan terus berjalan bagi jutaan pelanggan bulanan aktif di lebih dari 40 negara dan kawasan. Namun, ketika tim ditugaskan untuk mendukung proyek xCloud, pengalaman streaming game dengan persyaratan latensi yang sangat rendah untuk pemain game di seluruh dunia, menjadi jelas bahwa diperlukan upaya untuk keluar dari peran rekayasa layanan tradisional mereka, memecah silo tim, dan menemukan kembali cara baru untuk bekerja.

Seseorang sedang berbicara di dalam ruang rapat

Tantangan: Beradaptasi dengan model operasi cloud

"Bahkan perubahan kecil pun akan menimbulkan risiko yang signifikan, yang berarti kami menghabiskan banyak waktu untuk menanganinya. Mode operasi kami sebagian besar bersifat reaktif, dan kami tidak sepenuhnya diberi wewenang untuk mengubahnya."

James Whitesides, SRE PM, Operasi dan Keandalan Xbox

Memecahkan masalah skala melalui kolaborasi dan otomatisasi

Di tahap awal proyek, tim pengembangan menyadari bahwa tim perlu menghadirkan xREO untuk membantu merancang dan membangun arsitektur baru yang akan memanfaatkan jangkauan global Azure. Dimulai dengan kontainer untuk memisahkan kode layanan dari infrastruktur dan Kubernetes sebagai pilihan utama untuk orkestrasi, tim memilih Azure Kubernetes Service (AKS) yang sepenuhnya terkelola untuk menghilangkan banyak kompleksitas manajemen.

Namun, bahkan dengan sistem yang telah disederhanakan ini, volume tugas manual yang diperlukan untuk membuat setiap kluster Kubernetes dengan cepat membuat tim xREO kewalahan. Untuk kemampuan melakukan pekerjaan berulang dan otomatisasi, tim memutuskan untuk membangun alur integrasi berkelanjutan/pengiriman berkelanjutan (CI/CD) dengan Azure Pipelines, menggunakan templat Azure Resource Manager untuk menyediakan sumber daya dengan cepat.

Tantangan: Beradaptasi dengan model operasi cloud

"Sekarang, dalam peran SRE, kami membangun platform bersama dengan pengembang, dan kami menjadi bagian dari proses penyebaran pengembang. Kami benar-benar fokus pada pembuatan dan peningkatan, bukan pada sekadar mencentang daftar periksa."

James Whitesides, SRE PM, Operasi dan Keandalan Xbox

Mengambil peran baru dengan misi baru

Saat ini alur CI/CD menyebarkan lebih dari 35 layanan mikro berbasis AKS yang mengandalkan lebih dari 100 sumber daya (per kawasan) ke berbagai kawasan Azure, dan akan terus bertambah. Untuk menyebarkan kawasan baru, tim menambahkan enam baris kode dan menunggu sumber daya diaktifkan.

Dengan penyebaran yang sepenuhnya otomatis, tim xREO telah beralih ke peran rekayasa keandalan situs (SRE) dan tim menghabiskan sebagian besar waktu untuk membuat alat baru, bukan untuk memperbaiki masalah. Tim sering diminta pendapat sebagai mitra tepercaya bagi tim pengembangan, dan berfokus pada pekerjaan proaktif, bernilai tinggi, dan sangat bermanfaat.