Přeskočit navigaci

Spolehlivost Azure

Získejte potřebné nástroje a školení, abyste mohli spolehlivě navrhovat a provozovat kritické systémy.

Spolehlivost je sdílená zodpovědnost

Díky odolnému základu cloudové platformy Azure můžete dosáhnout cílů spolehlivosti vaší organizace pro všechny úlohy. Navrhněte a provozujte své klíčové aplikace s jistotou, že můžete svému cloudu důvěřovat, protože Azure upřednostňuje transparentnost. Během problémů se službou vás vždy budeme informovat, abyste mohli rychle reagovat.

Pokud chcete optimalizovat stávající aplikaci v Azure, začněte platformou Azure Well-Architected Framework, což je sada vůdčích principů postavených na pěti základních pilířích: spolehlivost, zabezpečení, efektivitu výkonu, optimalizace nákladů a špičková provozní úroveň.

Začněte se spolehlivým základem v infrastruktuře Azure

Seznamte se s probíhajícími investicemi Microsoftu do údržby a vylepšení spolehlivosti cloudové platformy v blogovém seriálu o zvýšení spolehlivosti od technického ředitele a odborníka na Azure Marka Russinoviche, včetně těchto čtyř posledních témat: spolehlivost sítě prostřednictvím inteligentního softwaru, bezpečný vývoj s využitím AIOps – představení systému Gandalf, modelování hrozeb za účelem zvýšení odolnosti rozsáhlých distribuovaných systémů a údržba s nízkým nebo žádným dopadem.

Síť Microsoftu spojuje více než 60 oblastí Azure, 220 datových center Azure, 170 hraničních lokalit a přes 165 000 kilometrů pozemních a podmořských optických kabelů po celém světě, které se připojí ke zbytku internetu na strategických globálních hraničních místech. Další informace o spolehlivosti sítě Microsoftu najdete v tomto dvoudílném blogovém příspěvku.

Základní součástí procesu nasazení je průběžné monitorování metrik stavu, ve kterém hraje důležitou roli AIOps. V tomto blogovém příspěvku se dozvíte, jak AI a strojové učení pomáhají technikům DevOps, monitorovat proces nasazení v Azure ve velkém, včas detekovat problémy a postupně zavádět nebo vracet rozhodnutí v závislosti na rozsahu a závažnosti dopadu.

Zjistěte, jak technické týmy služeb Azure využívají příčiny selhání jako nástroj k lepšímu porozumění, k jakému problému a jak došlo a dopadu výpadků na zákazníky, a seznamte se s procesy modelování hrozeb za účelem určení příčin selhání a zvýšení odolnosti.

Přečtěte si o technologiích aktualizací, včetně horkých oprav, údržby se zachováním paměti a migrace za provozu, které Azure používá k údržbě své infrastruktury a které mají nízký nebo žádný dopad na zákazníky nebo potřebu odstávky.

Zvolte správné možnosti odolnosti Azure pro vaše potřeby

Zjistěte, které možnosti vysoké dostupnosti, zotavení po havárii a zálohování Azure používat s vašimi aplikacemi. Také se dozvíte, jak vybrat možnosti výpočetních funkcí, úložiště a geografické redundance (místní, zónové nebo regionální), které jsou pro vás nejvhodnější.

Povolte integrovanou odolnost

Využijte výhod volitelných služeb a funkcí Azure, abyste dosáhli svých specifických cílů spolehlivosti.

Zóny dostupnosti

Spouštějte kritické úlohy napříč datacentry s nezávislým napájením, chlazením a sítěmi.

Skupiny dostupnosti

Kolokace nebo oddělení prostředků vám umožní zajistit redundanci v rámci datacentra.

Azure Traffic Manager

Implementujte automatické převzetí služeb při selhání, optimalizujte provoz a kombinujte místní a cloudové systémy.

Azure Site Recovery

Replikujte místní úlohy a úlohy Azure z primární lokality do sekundárního umístění.

Azure Backup

Zálohujte data pomocí jednoduchého, zabezpečeného a nákladově úsporného řešení pro zotavení a obnovení.

Azure Storage

Vytvářejte a ukládejte více kopií vašich dat s možnostmi redundance pro libovolný scénář.

Monitorujte svůj cloud, aby to nebyla černá skříňka

Zajistěte dlouhodobou spolehlivost pomocí nástrojů pro monitorování, abyste identifikovali, diagnostikovali a sledovali anomálie, a tak optimalizovali spolehlivost i výkon.

Azure Chaos Studio

Systematicky zvyšujte odolnost s využitím řízeného chaosu.

Azure Service Health

Identifikujte problémy s prostředky a vyřešte je pomocí přizpůsobitelného řídicího panelu.

Azure Monitor

Shromažďujte a analyzujte telemetrické údaje z Azure i místních prostředí a dál s nimi pracujte.

Azure Application Insights

Získejte inteligentní přehledy o využití aplikací a diagnostikujte anomálie.

Network Watcher

Monitorujte, diagnostikujte a získávejte přehledy o výkonu a stavu sítě.

Azure Advisor

Optimalizujte aplikace a systémy z hlediska spolehlivosti pomocí doporučení na základě telemetrie využití.

Spolehlivost, které důvěřují organizace všech velikostí

ClearBank posiluje odolnost infrastruktury, důvěru zákazníků a konkurenční hodnotu

"Ensuring end-to-end reliability and resiliency is a team effort. We get the tools from Azure, and we set up the systems and processes to put it all together."

Tom Harris, ředitel pro technologie, ClearBank
ClearBank

Kodak Alaris zvyšuje produktivitu tím, že zlepšuje odolnost ERP

"The one thing I don't want is my CIO coming to me because there's a problem with our ERP. The truth is, it never happens anymore—it's a real testament to our ERP's reliability in Azure."

– Joseph Calabrese, IT Operations Manager, Kodak Alaris
Kodak Alaris

Největší letiště v Srbsku nabírá výšku s automatickým obnovením

"We wanted a business continuity plan for recovery for the business systems we need to run the airport, but without the expense of commissioning and maintaining secondary infrastructure. We also wanted to ensure recovery is fast and automated in the event of any failure."

– Marko Marković, ředitel oddělení IT, AD Aerodrom Nikola Tesla Beograd
AD Aerodrom Nikola Tesla Beograd

Marie Curie poskytuje stabilnější a spolehlivější služby

"In the last two and a half years, we've had one outage which has been due to cloud infrastructure failing. It just almost instantly gave us stability, space to breathe, enabled us to focus on bringing real value to the organization."

Ivan Delany, ředitel pro IT, Marie Curie
Marie Curie

Juvare zvyšuje spolehlivost a zlepšuje integritu své platformy pro incidenty

"We architected our solution to spread workloads across different availability zones and regions, to maintain both client requirements for geographic data residency but also to ensure that if one particular part of our infrastructure was having a problem, it reduced the blast radius."

Bryan Kaplan, ředitel informačních technologií, Juvare
Juvare

Společnost GEP zvýšila spolehlivost své logistické platformy

"We use AKS or Azure Kubernetes Service inbuilt node pools...say your primary node pool is down, within the cluster you're automatically able to failover to the second availability zone."

Nithin Prasad, hlavní inženýr, GEP
gep

Dokumentace, školení a prostředky

Centrum architektury Azure

Vytvářejte spolehlivá řešení pomocí zavedených vzorů a osvědčených postupů:

Microsoft Learn

Získejte nové dovednosti, které vám pomůžou zajistit vyšší spolehlivost aplikací a systémů, pomocí těchto bezplatných výukových modulů Microsoft Learn:

SRE (Site Reliability Engineering)

Naučte se používat SRE, disciplínu, která organizacím pomáhá dosáhnout odpovídající úrovně spolehlivosti v jejich systémech, službách a produktech:

Přečtěte si další informace o tom, jak navrhovat z hlediska spolehlivosti, jednoho z pěti pilířů profesionálního návrhu v rámci dobře navržené architektury Azure