Navigáció kihagyása

A Microsoft Xbox-csapat az SRE szerepkört használja egy új játéksztreamelési szolgáltatás készítéséhez

Tekintse meg, hogyan váltak az üzemeltető és a fejlesztői csapat megbízható partnerekké egy globálisan elosztott Kubernetes üzembe helyezés kiépítése kapcsán.

A teljes cikk

A feladat: Folyamat létrehozása globális méretezéshez

Sok üzemeltetési csapathoz hasonlóan az Xbox megbízhatósági mérnöki és üzemeltetési (xREO) csapata is sok időt töltött ismétlődő, manuális feladatok végrehajtásával az adatközpontok karbantartásához, új kód üzembe helyezéséhez és azokra a problémákra való reagálással, amelyek a nem általuk tervezett monolitikus, merev architektúrában való munkavégzésből erednek. A szolgáltatás több mint 40 országban és régióban több millió aktív havi előfizető számára volt működőképes. De amikor a csapatnak a project xCloud támogatásával kellett foglalkoznia, amely egy rendkívül alacsony késési követelményekkel rendelkező játékstreamelési élmény a játékosok számára világszerte, egyértelművé vált, hogy ki kell lépniük a hagyományos szolgáltatástervezési szerepkörükből, meg kell szüntetniük a csapatsilókat, és újra kell gondolniuk azt, hogy hogyan dolgoznak.

"Even small changes posed a significant risk, which meant we spent a lot of our time firefighting. Our mode of operation was mostly reactive, and we weren't really empowered to do much about it."

James Whitesides, SRE-projektmenedzser, Xbox-megbízhatóság és -üzemeltetés

Méretezhető megoldás együttműködéssel és automatizálással

A projekt korai szakaszában a fejlesztői csapat felismerte, hogy az xREO-t kell használniuk ahhoz, hogy olyan új architektúrát tervezhessenek és alakíthassanak ki, amely ki tudná használni az Azure globális elérését. A tárolóktól kezdve a szolgáltatáskód infrastruktúrától való elválasztásához, amihez a Kubernetes-vezénylés volt a nyilvánvaló választás, a csapatok a teljes mértékben felügyelt Azure Kubernetes Service (AKS) lehetőséget választották a felügyelet bonyolultságának kiküszöböléséhez.

Ennek ellenére az egyes Kubernetes-fürtök létrehozásához szükséges manuális feladatok mennyisége még ezzel az egyszerűsített rendszerrel is túlterhelte az xREO-csapatot. Az ismételhetőség és az automatizálás érdekében úgy döntöttek, hogy létrehoznak egy folyamatos integrációs/folyamatos teljesítési (CI/CD) folyamatot az Azure Pipelines segítségével, valamint az Azure Resource Manager sablonokat használva az erőforrások gyors kiépítéséhez.

"Now, in the SRE role, we build the platform with the devs, and we are part of their deployment process. We're really focused on building and improving rather than burning down checklists."

James Whitesides, SRE-projektmenedzser, Xbox-megbízhatóság és -üzemeltetés

Új szerepkör vállalása új küldetéssel

A CI/CD-folyamat mára számos Azure-régióban több mint 35 AKS-alapú mikroszolgáltatást helyez üzembe, amely több 100 erőforrásra támaszkodik (régiónként) és még ennél is több várható. Új régió üzembe helyezéséhez a csapat felvesz hat új kódsort, és várakozik az erőforrások elérhetővé válására.

A teljesen automatizált üzembe helyezéssel az xREO-csapat a helymegbízhatósági mérnöki munka (SRE) szerepkörére váltott és a hibák javítása helyett új eszközök készítésével tölti ideje nagy részét. A fejlesztési csapat megbízható partnereként gyakran lép velük kapcsolatba, és a proaktív, nagyértékű és nagy megelégedettséggel járó munkára koncentrálhatnak.

Vessünk egy közelebbi pillantást a csapat SRE szerepkörre történő átalakítására.

A teljes cikk