Azure reliability
Få de verktyg och den utbildning du behöver för att utforma och hantera verksamhetskritiska system utan bekymmer.
Tillförlitlighet är ett delat ansvar
Uppfyll organisationens krav på tillförlitlighet för alla arbetsbelastningar genom att börja med en stabil grund – Azure-molnplattformen. Utforma och hantera verksamhetskritiska program med tillförsikt och med vetskap om att du kan lita på ditt moln eftersom Azure prioriterar transparens och alltid håller dig informerad så att du kan agera snabbt vid tjänstproblem.
Om du vill optimera ett befintligt program på Azure kan du börja med Azure Well-Architected Framework, en uppsättning vägledande principer som vilar på fem grundpelare: tillförlitlighet, säkerhet, prestandaeffektivitet, kostnadsoptimering och driftseffektivitet.
Börja med en tillförlitlig grund i Azure-infrastrukturen
Lär dig mer om pågående Microsoft-investeringar för att underhålla och förbättra molnplattformens tillförlitlighet i Azure CTO och Technical Fellow Mark Russinovichs bloggserie Advancing Reliability, inklusive dessa fyra senaste avsnitt: nätverkstillförlitlighet via intelligent programvara, säker utveckling med AIOps – introduktion till Gandalf, hotmodellering för motståndskraft för stora distribuerade system samt underhåll med låg och ingen påverkan.
Microsofts nätverk omfattar fler än 60 Azure-regioner, 200 Azure-datacenter, 190 gränsplatser och över 281 000 km mark- och havsdragen fiber över hela världen, och ansluter till resten av Internet vid strategiska globala anslutningspunkter. Läs mer om Microsofts nätverkstillförlitlighet i det här blogginlägget i två delar.
Kontinuerlig övervakning av hälsomått är en grundläggande del av distributionsprocessen och det är här SOM AIOps spelar en viktig roll. I här blogginlägget lär du dig hur AI och maskininlärning används för att ge DevOps-tekniker, övervaka Azure-distributionsprocessen i stor skala, identifiera problem tidigt och fatta beslut om distribution eller återställning baserat på påverkansomfång och allvarlighetsgrad.
Ta reda på hur Azures team för tjänstteknik använder ”postmortems” som ett verktyg för att bättre förstå vad som gick fel, hur det gick till och hur kunderna påverkas av avbrott – och få insikter om postmortem och processer för hotmodellering för motståndskraft.
Lär dig mer om uppdateringstekniker med låg eller ingen påverkan – inklusive snabbkorrigering, minnesbevarande underhåll och direktmigrering – som Azure använder för att upprätthålla sin infrastruktur med liten eller ingen kundpåverkan eller avbrottstid.
Välj rätt Azure-återhämtningsfunktioner för dina behov
Ta reda på vilka resurser i Azure med hög tillgänglighet, haveriberedskap och säkerhetskopiering som passar för användning med dina appar. Lär dig också hur du väljer alternativ för beräkning, lagring och geografi (lokalt, zonindelat och regionalt) som passar dig.
Aktivera inbyggd återhämtning
Dra nytta av Azures tillvalstjänster och -funktioner för att uppfylla dina specifika krav på tillförlitlighet.
Tillgänglighetszoner
Kör kritiska arbetsbelastningar i datacenter med oberoende strömförsörjning, kylning och nätverk.
Tillgänglighetsuppsättningar
Uppnå redundans inom ett datacenter genom att placera resurser tillsammans eller separera dem.
Azure Traffic Manager
Implementera automatisk redundans, optimera trafiken och kombinera lokala och molnbaserade system.
Azure Site Recovery
Replikera lokala arbetsbelastningar och Azure-arbetsbelastningar från en primär webbplats till en sekundär plats.
Azure Backup
Säkerhetskopiera data med en enkel, säker och kostnadseffektiv återställningslösning.
Azure Storage
Skapa och lagra flera kopior av dina data med alternativ för redundans för alla scenarier.
Övervaka ditt moln så att det inte blir som en svart låda
Säkerställ långsiktig tillförlitlighet med övervakningsverktyg för att identifiera, diagnostisera och spåra avvikelser – och optimera din tillförlitlighet och prestanda.
Azure Chaos Studio
Förbättra motståndskraften systematiskt med kontrollerat kaos.
Azure Service Health
Identifiera resursproblem och lös dem med en anpassningsbar instrumentpanel.
Azure Monitor
Samla in, analysera och agera på telemetridata från Azure och lokala miljöer.
Azure Application Insights
Få intelligenta insikter om användningen av appar och diagnostisera avvikelser.
Network Watcher
Övervaka, diagnostisera och få kunskaper om nätverkets prestanda och skick.
Azure Advisor
Optimera appar och system för tillförlitlighet med rekommendationer baserade på användningstelemetri.
Dokumentation, utbildning och resurser
Azure Architecture Center
Bygg pålitliga lösningar med etablerade mönster och de bästa metoderna:
Microsoft Learn
Få nya kunskaper som hjälper dig att göra dina appar och system mer pålitliga med de här kostnadsfria Microsoft Learn-modulerna:
SRE (Site Reliability Engineering)
Lär dig hur du använder SRE, en disciplin som hjälper organisationer att uppnå rätt nivå av tillförlitlighet i system, tjänster och produkter: