Hoppa över navigering

Tillförlitlighet i Azure

Få de verktyg och den utbildning du behöver för att utforma och hantera verksamhetskritiska system utan bekymmer

Tillförlitlighet är ett delat ansvar

Uppfyll organisationens krav på tillförlitlighet för alla arbetsbelastningar genom att börja med en stabil grund – Azure-molnplattformen. Utforma och hantera verksamhetskritiska program med tillförsikt och med vetskap om att du kan lita på ditt moln eftersom Azure prioriterar transparens och alltid håller dig informerad så att du kan agera snabbt vid tjänstproblem.

Om du vill optimera ett befintligt program på Azure kan du börja med Azure Well-Architected Framework, en uppsättning vägledande principer som vilar på fem grundpelare: tillförlitlighet, säkerhet, prestandaeffektivitet, kostnadsoptimering och driftseffektivitet.

Börja med en tillförlitlig grund i Azure-infrastrukturen

Lär dig mer om pågående Microsoft-investeringar för att underhålla och förbättra molnplattformens tillförlitlighet i Azure CTO och Technical Fellow Mark Russinovichs bloggserie Advancing Reliability, inklusive dessa fyra senaste avsnitt: nätverkstillförlitlighet via intelligent programvara, säker utveckling med AIOps – introduktion till Gandalf, hotmodellering för motståndskraft för stora distribuerade system samt underhåll med låg och ingen påverkan.

Microsofts nätverk omfattar fler än 60 Azure-regioner, 220 Azure-datacenter, 170 gränsplatser och över 265 000 km mark- och havsdragen fiber över hela världen, och ansluter till resten av Internet vid strategiska globala anslutningspunkter. Läs mer om Microsofts nätverkstillförlitlighet i det här blogginlägget i två delar.

Kontinuerlig övervakning av hälsomått är en grundläggande del av distributionsprocessen och det är här SOM AIOps spelar en viktig roll. I här blogginlägget lär du dig hur AI och maskininlärning används för att ge DevOps-tekniker, övervaka Azure-distributionsprocessen i stor skala, identifiera problem tidigt och fatta beslut om distribution eller återställning baserat på påverkansomfång och allvarlighetsgrad.

Ta reda på hur Azures team för tjänstteknik använder ”postmortems” som ett verktyg för att bättre förstå vad som gick fel, hur det gick till och hur kunderna påverkas av avbrott – och få insikter om postmortem och processer för hotmodellering för motståndskraft.

Lär dig mer om uppdateringstekniker med låg eller ingen påverkan – inklusive snabbkorrigering, minnesbevarande underhåll och direktmigrering – som Azure använder för att upprätthålla sin infrastruktur med liten eller ingen kundpåverkan eller avbrottstid.

Välj rätt Azure-återhämtningsfunktioner för dina behov

Ta reda på vilka resurser i Azure med hög tillgänglighet, haveriberedskap och säkerhetskopiering som passar för användning med dina appar. Lär dig också hur du väljer alternativ för beräkning, lagring och geografi (lokalt, zonindelat och regionalt) som passar dig.

En infografisk PDF som visar hur olika Azure-tjänster ger olika återhämtningsfunktioner

Aktivera inbyggd återhämtning

Dra nytta av Azures tillvalstjänster och -funktioner för att uppfylla dina specifika krav på tillförlitlighet.

Tillgänglighetszoner

Kör kritiska arbetsbelastningar i datacenter med oberoende strömförsörjning, kylning och nätverk.

Tillgänglighetsuppsättningar

Uppnå redundans inom ett datacenter genom att placera resurser tillsammans eller separera dem.

Azure Traffic Manager

Implementera automatisk redundans, optimera trafiken och kombinera lokala och molnbaserade system.

Azure Site Recovery

Replikera lokala arbetsbelastningar och Azure-arbetsbelastningar från en primär webbplats till en sekundär plats.

Azure Backup

Säkerhetskopiera data med en enkel, säker och kostnadseffektiv återställningslösning.

Azure Storage

Skapa och lagra flera kopior av dina data med alternativ för redundans för alla scenarier.

Övervaka ditt moln så att det inte blir som en svart låda

Säkerställ långsiktig tillförlitlighet med övervakningsverktyg för att identifiera, diagnostisera och spåra avvikelser – och optimera din tillförlitlighet och prestanda.

Azure Chaos Studio

Förbättra motståndskraften systematiskt med kontrollerat kaos.

Azure Tjänstehälsa

Identifiera resursproblem och lös dem med en anpassningsbar instrumentpanel.

Azure Monitor

Samla in, analysera och agera på telemetridata från Azure och lokala miljöer.

Azure Application Insights

Få intelligenta insikter om användningen av appar och diagnostisera avvikelser.

Network Watcher

Övervaka, diagnostisera och få kunskaper om nätverkets prestanda och skick.

Azure Advisor

Optimera appar och system för tillförlitlighet med rekommendationer baserade på användningstelemetri.

Tillförlitlighet som är betrodd av organisationer i alla storlekar

ClearBank bygger motståndskraft för infrastrukturer, kundförtroende och konkurrenskraftigt värde

"Ensuring end-to-end reliability and resiliency is a team effort. We get the tools from Azure, and we set up the systems and processes to put it all together."

Tom Harris, Chief Technology Officer, ClearBank
ClearBank

Kodak Alaris ökar produktiviteten genom att förbättra ERP-systemets återhämtningsförmåga

"The one thing I don't want is my CIO coming to me because there's a problem with our ERP. The truth is, it never happens anymore—it's a real testament to our ERP's reliability in Azure."

– Joseph Calabrese, IT Operations Manager, Kodak Alaris
Kodak Alaris

University of Miami optimerar tillförlitligheten med Microsoft Azure

"Whenever we think of a solution, we think, 'How can we do this in the cloud versus on-premises?' It not only makes us more resilient, but more flexible and nimble as well."

Mari Lovo, Director, IT, Cloud Infrastructure Services, University of Miami
University of Miami

Marie Curie tillhandahåller mer stabila och tillförlitliga tjänster

"In the last two and a half years, we've had one outage which has been due to cloud infrastructure failing. It just almost instantly gave us stability, space to breathe, enabled us to focus on bringing real value to the organization."

Ivan Delany, IT Director, Marie Curie
Marie Curie

Juvare driver tillförlitlighet och integritet för sin incidentplattform

"We architected our solution to spread workloads across different availability zones and regions, to maintain both client requirements for geographic data residency but also to ensure that if one particular part of our infrastructure was having a problem, it reduced the blast radius."

Bryan Kaplan, Chief Information Officer, Juvare
Juvare

GEP förbättrade tillförlitligheten för sin logistikplattform

"We use AKS or Azure Kubernetes Service inbuilt node pools...say your primary node pool is down, within the cluster you're automatically able to failover to the second availability zone."

Nithin Prasad, Principal Engineer, GEP
gep

Dokumentation, utbildning och resurser

Azure arkitekturcenter

Bygg pålitliga lösningar med etablerade mönster och de bästa metoderna:

Microsoft Learn

Få nya kunskaper som hjälper dig att göra dina appar och system mer pålitliga med de här kostnadsfria Microsoft Learn-modulerna:

SRE (Site Reliability Engineering)

Lär dig hur du använder SRE, en disciplin som hjälper organisationer att uppnå rätt nivå av tillförlitlighet i system, tjänster och produkter:

Lär dig mer om utformning för tillförlitlighet, en av de fem grundarna för en utmärkt arkitektur i Azure Well-Architected Framework

Läs mer
Kan vi hjälpa dig?