Tillförlitlighet i Azure
Få de verktyg och den utbildning du behöver för att utforma och hantera verksamhetskritiska system utan bekymmer
Tillförlitlighet är ett delat ansvar
Uppfyll organisationens krav på tillförlitlighet för alla arbetsbelastningar genom att börja med en stabil grund – Azure-molnplattformen. Utforma och hantera verksamhetskritiska program med tillförsikt och med vetskap om att du kan lita på ditt moln eftersom Azure prioriterar transparens och alltid håller dig informerad så att du kan agera snabbt vid tjänstproblem.
Om du vill optimera ett befintligt program på Azure kan du börja med Azure Well-Architected Framework, en uppsättning vägledande principer som vilar på fem grundpelare: tillförlitlighet, säkerhet, prestandaeffektivitet, kostnadsoptimering och driftseffektivitet.

Börja med en tillförlitlig grund i Azure-infrastrukturen
Lär dig mer om pågående Microsoft-investeringar för att underhålla och förbättra molnplattformens tillförlitlighet i Azure CTO och Technical Fellow Mark Russinovichs bloggserie Advancing Reliability, inklusive dessa fyra senaste avsnitt: nätverkstillförlitlighet via intelligent programvara, säker utveckling med AIOps – introduktion till Gandalf, hotmodellering för motståndskraft för stora distribuerade system samt underhåll med låg och ingen påverkan.
Microsofts nätverk omfattar fler än 60 Azure-regioner, 220 Azure-datacenter, 170 gränsplatser och över 265 000 km mark- och havsdragen fiber över hela världen, och ansluter till resten av Internet vid strategiska globala anslutningspunkter. Läs mer om Microsofts nätverkstillförlitlighet i det här blogginlägget i två delar.

Kontinuerlig övervakning av hälsomått är en grundläggande del av distributionsprocessen och det är här SOM AIOps spelar en viktig roll. I här blogginlägget lär du dig hur AI och maskininlärning används för att ge DevOps-tekniker, övervaka Azure-distributionsprocessen i stor skala, identifiera problem tidigt och fatta beslut om distribution eller återställning baserat på påverkansomfång och allvarlighetsgrad.

Ta reda på hur Azures team för tjänstteknik använder ”postmortems” som ett verktyg för att bättre förstå vad som gick fel, hur det gick till och hur kunderna påverkas av avbrott – och få insikter om postmortem och processer för hotmodellering för motståndskraft.

Lär dig mer om uppdateringstekniker med låg eller ingen påverkan – inklusive snabbkorrigering, minnesbevarande underhåll och direktmigrering – som Azure använder för att upprätthålla sin infrastruktur med liten eller ingen kundpåverkan eller avbrottstid.

Välj rätt Azure-återhämtningsfunktioner för dina behov
Ta reda på vilka resurser i Azure med hög tillgänglighet, haveriberedskap och säkerhetskopiering som passar för användning med dina appar. Lär dig också hur du väljer alternativ för beräkning, lagring och geografi (lokalt, zonindelat och regionalt) som passar dig.

Aktivera inbyggd återhämtning
Dra nytta av Azures tillvalstjänster och -funktioner för att uppfylla dina specifika krav på tillförlitlighet.
Tillgänglighetszoner
Kör kritiska arbetsbelastningar i datacenter med oberoende strömförsörjning, kylning och nätverk.
Tillgänglighetsuppsättningar
Uppnå redundans inom ett datacenter genom att placera resurser tillsammans eller separera dem.
Azure Traffic Manager
Implementera automatisk redundans, optimera trafiken och kombinera lokala och molnbaserade system.
Azure Site Recovery
Replikera lokala arbetsbelastningar och Azure-arbetsbelastningar från en primär webbplats till en sekundär plats.
Azure Backup
Säkerhetskopiera data med en enkel, säker och kostnadseffektiv återställningslösning.
Azure Storage
Skapa och lagra flera kopior av dina data med alternativ för redundans för alla scenarier.
Övervaka ditt moln så att det inte blir som en svart låda
Säkerställ långsiktig tillförlitlighet med övervakningsverktyg för att identifiera, diagnostisera och spåra avvikelser – och optimera din tillförlitlighet och prestanda.
Azure Chaos Studio
Förbättra motståndskraften systematiskt med kontrollerat kaos.
Azure Tjänstehälsa
Identifiera resursproblem och lös dem med en anpassningsbar instrumentpanel.
Azure Monitor
Samla in, analysera och agera på telemetridata från Azure och lokala miljöer.
Azure Application Insights
Få intelligenta insikter om användningen av appar och diagnostisera avvikelser.
Network Watcher
Övervaka, diagnostisera och få kunskaper om nätverkets prestanda och skick.
Azure Advisor
Optimera appar och system för tillförlitlighet med rekommendationer baserade på användningstelemetri.
Tillförlitlighet som är betrodd av organisationer i alla storlekar
ClearBank bygger motståndskraft för infrastrukturer, kundförtroende och konkurrenskraftigt värde
Tom Harris, Chief Technology Officer, ClearBank"Ensuring end-to-end reliability and resiliency is a team effort. We get the tools from Azure, and we set up the systems and processes to put it all together."

Kodak Alaris ökar produktiviteten genom att förbättra ERP-systemets återhämtningsförmåga
– Joseph Calabrese, IT Operations Manager, Kodak Alaris"The one thing I don't want is my CIO coming to me because there's a problem with our ERP. The truth is, it never happens anymore—it's a real testament to our ERP's reliability in Azure."

University of Miami optimerar tillförlitligheten med Microsoft Azure
Mari Lovo, Director, IT, Cloud Infrastructure Services, University of Miami"Whenever we think of a solution, we think, 'How can we do this in the cloud versus on-premises?' It not only makes us more resilient, but more flexible and nimble as well."

Marie Curie tillhandahåller mer stabila och tillförlitliga tjänster
Ivan Delany, IT Director, Marie Curie"In the last two and a half years, we've had one outage which has been due to cloud infrastructure failing. It just almost instantly gave us stability, space to breathe, enabled us to focus on bringing real value to the organization."

Juvare driver tillförlitlighet och integritet för sin incidentplattform
Bryan Kaplan, Chief Information Officer, Juvare"We architected our solution to spread workloads across different availability zones and regions, to maintain both client requirements for geographic data residency but also to ensure that if one particular part of our infrastructure was having a problem, it reduced the blast radius."

GEP förbättrade tillförlitligheten för sin logistikplattform
Nithin Prasad, Principal Engineer, GEP"We use AKS or Azure Kubernetes Service inbuilt node pools...say your primary node pool is down, within the cluster you're automatically able to failover to the second availability zone."
