Fiabilité d’Azure
Obtenez les outils et la formation dont vous avez besoin pour concevoir et exploiter des systèmes stratégiques en toute confiance
La fiabilité est une responsabilité partagée
Atteignez les objectifs de fiabilité de votre organisation pour toutes vos charges de travail en commençant par les bases résilientes de la plateforme cloud Azure. Concevez et exploitez vos applications stratégiques en toute confiance, en sachant que vous pouvez faire confiance à votre cloud, car Azure donne la priorité à la transparence, en vous laissant toujours informé et capable de réagir rapidement pendant les problèmes de service.
Si vous envisagez d’optimiser une application existante sur Azure, commencez avec le Azure Well-Architected Framework, ensemble de principes directeurs sur cinq piliers de base : la fiabilité, la sécurité, l’efficacité des performances, l’optimisation des coûts et l’excellence opérationnelle.

Commencer par une base fiable sur l’infrastructure Azure
Apprenez-en plus sur les investissements Microsoft en cours pour gérer et améliorer la fiabilité de la plateforme Cloud dans la série de blogs sur la fiabilité avancée du directeur technique d’Azure et ingénieur technique Mark Russinovich, y compris ces quatre rubriques récentes : fiabilité du réseau par le biais de logiciels intelligents, développement sécurisé avec AIOps - présentation de Gandalf, modélisation des menaces pour les systèmes distribués de grande taille et maintenance à impact faible à nul.
Le réseau Microsoft connecte plus de 60 régions Azure, 200 centres de données Azure, 190 sites de périphérie et plus de 280 000 km de fibres terrestres et sous-marines dans le monde entier, qui se connecte au reste de l’Internet à des points de présence stratégiques à l’échelle mondiale. En savoir plus sur la fiabilité du réseau Microsoft dans ce billet de blog en deux parties.

La surveillance continue des mesures d’intégrité est une partie fondamentale du processus de déploiement, et c’est là que AIOps joue un rôle critique. Dans ce billet de blog, découvrez comment l’IA et le Machine Learning sont utilisés pour aider les ingénieurs DevOps à surveiller le processus de déploiement Azure à grande échelle, à détecter les problèmes de façon anticipée et à prendre des décisions de déploiement ou de restauration en fonction de l’étendue et de la gravité de l’impact.

Découvrez comment les équipes d’ingénierie des services Azure utilisent les « post-mortems » en tant qu’outil pour mieux comprendre ce qui s’est passé, en quoi ça s’est mal passé et l’impact client des pannes, et obtenez des insights sur les processus de post-mortem et modélisation des menaces de résilience.

Découvrez les technologies de mise à jour sans impact ou à faible impact, notamment les correctifs à chaud, la maintenance de préservation de la mémoire et la migration en direct, qu’Azure utilise pour que son infrastructure réduise au minimum le temps d’arrêt et l’impact sur le client.

Choisissez les fonctionnalités de résilience Azure adaptées à vos besoins
Découvrez les fonctionnalités Azure de haute disponibilité, de récupération d’urgence et de sauvegarde à utiliser avec vos applications. Apprenez également à sélectionner les options de calcul, de stockage et de redondance géographique (locale, zonale et régionale) qui vous conviennent.

Activez la résilience intégrée
Tirez parti des services et fonctionnalités Azure facultatifs pour atteindre vos objectifs de fiabilité spécifiques.
Zones de disponibilité
Exécutez des charges de travail stratégiques dans des centres de données équipés d’une alimentation, d’un système de refroidissement et d’un réseau indépendants.
Groupes à haute disponibilité
Réalisez la redondance au sein d’un centre de données en colocalisant ou en séparant les ressources.
Azure Traffic Manager
Implémentez le basculement automatique, optimisez le trafic et combinez les systèmes locaux et dans le cloud.
Récupération de site Azure
Répliquez des charges de travail locales et Azure à partir d’un site principal vers un emplacement secondaire.
Sauvegarde Azure
Sauvegardez vos données grâce à une solution de récupération et de restauration simple, sûre et économique.
Stockage Azure
Créez et stockez plusieurs copies de vos données à l’aide des options de redondance pour n’importe quel scénario.
Surveillez votre cloud sorte qu’il ne serve pas de boîte noire
Garantissez une fiabilité à long terme avec les outils de supervision permettant d’identifier, de diagnostiquer et de suivre les anomalies, et ainsi d’optimiser votre fiabilité et vos performances.
Azure Chaos Studio
Améliorez systématiquement la résilience avec un chaos contrôlé.
Azure Service Health
Identifiez les problèmes de ressources et résolvez-les à l’aide d’un tableau de bord personnalisable.
Azure Monitor
Collectez, analysez et exploitez les données de télémétrie des environnements Azure et locaux.
Azure Application Insights
Obtenez des insights intelligents sur l’utilisation des applications et diagnostiquez les anomalies.
Network Watcher
Surveillez, diagnostiquez et analysez à l’aide d’insights sur les performances et l’intégrité du réseau.
Azure Advisor
Optimisez la fiabilité des applications et des systèmes grâce à des recommandations basées sur la télémétrie d’utilisation.
Fiabilité approuvée par les organisations de toutes tailles
ClearBank crée la résilience de l’infrastructure, la confiance des clients et la valeur concurrentielle
Tom Harris, directeur de la technologie, ClearBank"Ensuring end-to-end reliability and resiliency is a team effort. We get the tools from Azure, and we set up the systems and processes to put it all together."

Kodak Alaris augmente la productivité en améliorant la résilience ERP
– Joseph Calabrese, IT Operations Manager, Kodak Alaris"The one thing I don't want is my CIO coming to me because there's a problem with our ERP. The truth is, it never happens anymore—it's a real testament to our ERP's reliability in Azure."

Fiabilité des lecteurs de l’Université de l’Université de Microsoft Azure
Marie Lovo, Directeur informatique, Services d’infrastructure cloud, Université de Miami."Whenever we think of a solution, we think, 'How can we do this in the cloud versus on-premises?' It not only makes us more resilient, but more flexible and nimble as well."

Marie Curie fournit des services plus stables et fiables
Ivan Delany, directeur informatique, Marie Curie"In the last two and a half years, we've had one outage which has been due to cloud infrastructure failing. It just almost instantly gave us stability, space to breathe, enabled us to focus on bringing real value to the organization."

Juvare assure la fiabilité et l'intégrité de sa plateforme d'incidents
Bryan Kaplan, responsable de la sécurité des informations, Juvare"We architected our solution to spread workloads across different availability zones and regions, to maintain both client requirements for geographic data residency but also to ensure that if one particular part of our infrastructure was having a problem, it reduced the blast radius."

GEP a amélioré la fiabilité de sa plateforme logistique
Nithin Prasad, ingénieur principal, GEP"We use AKS or Azure Kubernetes Service inbuilt node pools...say your primary node pool is down, within the cluster you're automatically able to failover to the second availability zone."
