Concevoir et bâtir Azure ExpressRoute pour la résilience

Azure ExpressRoute est un service de connectivité hybride essentiel largement utilisé pour sa faible latence, sa résilience, sa connectivité privée à débit élevé entre son réseau local et les charges de travail Azure. Il permet d’assurer la fiabilité, la résilience et la récupération d’urgence dans les connexions réseau entre un site local et Azure afin de garantir la disponibilité des charges de travail métier et stratégiques. Cette fonctionnalité étend également l’accès aux ressources Azure de manière évolutive et rentable.

Diagramme illustrant une connexion entre un réseau local et Azure via ExpressRoute.

Les connexions réseau hautement fiables, résilientes et disponibles sont fondamentales pour un système bien structuré. La fiabilité se compose de deux principes : la résilience et la disponibilité. L’objectif de la résilience est d’éviter les défaillances et, en cas de défaillance, de restaurer vos applications à un état opérationnel complet. L’objectif de la disponibilité est de fournir un accès cohérent à votre application ou vos charges de travail. Il est important de planifier de manière proactive la fiabilité en fonction des besoins de votre entreprise et des exigences en matière d’application.

Les utilisateurs d’ExpressRoute s’appuient sur la disponibilité et les performances des sites de périphérie, du WAN et des zones de disponibilité pour maintenir leur connectivité à Azure. Toutefois, ces composants ou sites peuvent rencontrer des défaillances en raison de diverses raisons, telles que le dysfonctionnement de l’équipement, les perturbations du réseau, les conditions météorologiques ou les catastrophes naturelles. C’est donc une responsabilité conjointe des utilisateurs et de leur fournisseur de services cloud, lorsqu’il s’agit de planifier la fiabilité, la résilience et la disponibilité.

Résilience de site pour ExpressRoute

Il existe trois architectures de résilience ExpressRoute qui peuvent être utilisées pour garantir une haute disponibilité et une résilience entre vos connexions réseau local et Azure. Ces conceptions d’architecture sont les suivantes :

Résilience maximale

L’architecture de résilience maximale dans ExpressRoute est structurée pour éliminer tout point de défaillance unique dans le chemin du réseau Microsoft. Cette configuration est obtenue en configurant une paire de circuits entre deux emplacements distincts pour la diversité des sites avec ExpressRoute. L’objectif de résilience maximale est d’améliorer la fiabilité, la résilience et la disponibilité, ce qui garantit ainsi le niveau de résilience le plus élevé pour les charges de travail métier et/ou stratégiques. Pour ces opérations, nous vous recommandons de configurer une résilience maximale. Cette conception architecturale est recommandée dans le cadre du Well Architected Framework en ce qui concerne la fiabilité. L’équipe d’ingénierie ExpressRoute a développé une expérience de portail guidé pour vous aider à configurer une résilience maximale.

Diagramme illustrant une paire de circuits ExpressRoute, configurés à deux emplacements de peering distincts, entre un réseau local et Microsoft.

Résilience élevée

La résilience élevée, également appelée résilience site ou multisite, permet l’utilisation de plusieurs sites au sein de la même zone métropolitaine (Metro) pour connecter votre réseau local via ExpressRoute à Azure. La résilience élevée offre une diversité de sites en fractionnant un circuit unique sur deux sites. La première connexion est établie sur un site et la deuxième connexion sur un autre site. L’objectif de la résilience multisite est d’atténuer l’effet de l’isolation et des défaillances des sites de périphérie en introduisant des fonctionnalités pour permettre la diversité des sites. La diversité des sites est obtenue à l’aide d’un circuit unique sur des sites appairés au sein d’une ville métropolitaine, ce qui offre une résilience aux défaillances entre la périphérie et la région. La résilience élevée offre un niveau de résilience de site plus élevé que la résilience standard, mais pas autant que la résilience maximale. La résilience élevée est facturée de la même façon que la résilience standard, avec une parité de latence sur deux sites. Cette architecture peut être utilisée pour les charges de travail métier et stratégiques au sein d’une région. Pour plus d’informations, consultez Metro ExpressRoute.

Diagramme illustrant un seul circuit ExpressRoute, avec chaque lien configuré à deux emplacements de peering distincts.

Résilience standard

La résilience standard dans ExpressRoute est un circuit unique avec deux connexions configurées sur un site unique. La redondance intégrée (actif/actif) est configurée pour faciliter le basculement entre les deux connexions du circuit. Aujourd’hui, ExpressRoute offre deux connexions à un emplacement de peering unique. Si un échec se produit sur ce site, les utilisateurs peuvent rencontrer une perte de connectivité à leurs charges de travail Azure. Cette configuration est également appelée single-homed, car elle représente les utilisateurs avec un circuit ExpressRoute configuré avec un seul emplacement de peering. Cette configuration est considérée comme la moins résiliente et elle n’est pas recommandée pour les charges de travail métier ou stratégiques, car elle ne fournit pas de résilience de site.

Diagramme illustrant un circuit ExpressRoute unique, avec chaque lien configuré à un emplacement de peering unique.

Résilience zonale pour ExpressRoute

Les régions Azure font partie intégrante de votre stratégie de résilience et de conception ExpressRoute. Ces régions sont des emplacements géographiques de centres de données qui hébergent des services Azure. Les régions sont interconnectées via un réseau dédié à faible latence et sont conçues pour être hautement disponibles, tolérantes aux pannes et évolutives.

Azure offre plusieurs fonctionnalités pour garantir la résilience régionale. L’une de ces fonctionnalités est les zones de disponibilité. Les zones de disponibilité protègent les applications et les données contre toute défaillance du centre de données en couvrant plusieurs emplacements physiques au sein d’une région. Les régions et les zones de disponibilité sont essentielles à la stratégie de conception et de résilience de votre application. En utilisant les zones de disponibilité, vous pouvez améliorer la disponibilité et la résilience de vos déploiements. Pour plus d’informations, consultez Régions et zones de disponibilité.

Nous vous recommandons de déployer vos passerelles de réseau virtuel ExpressRoute en tant que zone redondantes entre les zones de disponibilité au sein d’une région. Ces zones de disponibilité sont des emplacements physiques distincts avec une infrastructure indépendante (alimentation, refroidissement et mise en réseau). L’objectif est de protéger votre connectivité réseau local à Azure contre les défaillances au niveau de la zone. Les passerelles ExpressRoute redondantes interzone offrent une résilience, une scalabilité et une meilleure disponibilité pour accéder aux services stratégiques sur Azure.

Les défaillances d’équipement ou les sinistres dans les centres de données régionaux et zonaux peuvent affecter les déploiements de passerelle ExpressRoute dans des réseaux virtuels. Si les passerelles ne sont pas déployées comme redondantes interzone, ces défaillances au sein d’un centre de données Azure peuvent affecter la capacité des utilisateurs à accéder à leurs charges de travail Azure.

Si vous disposez de passerelles ExpressRoute redondantes non interzone existantes, il est désormais possible de migrer vers une passerelle avec zone de disponibilité.

Recommandations

Voici des recommandations pour garantir la haute disponibilité, la résilience et la fiabilité dans votre architecture réseau ExpressRoute :

Recommandations en matière de circuit ExpressRoute

Planifier le circuit ExpressRoute ou ExpressRoute Direct

Pendant la phase de planification initiale, il est essentiel de déterminer s’il faut configurer un circuit ExpressRoute ou une connexion ExpressRoute Direct. Un circuit ExpressRoute permet une connexion dédiée privée à Azure avec l’aide d’un fournisseur de connectivité. ExpressRoute Direct permet l’extension d’un réseau local directement dans le réseau Microsoft à un emplacement de peering. Il est également nécessaire d’identifier l’exigence de bande passante et l’exigence de type de référence SKU du circuit pour répondre à vos besoins métier.

Évaluer la résilience des circuits ExpressRoute redondants multisite

Après avoir déployé des circuits ExpressRoute redondants multisite avec une résilience maximale, il est essentiel de s’assurer que les itinéraires locaux sont publiés sur les circuits redondants pour tirer pleinement parti des avantages de la redondance multisite. Pour évaluer la résilience et tester le basculement des circuits redondants et des itinéraires, visitez ce lien.

Planifier la configuration actif/actif

Pour améliorer la résilience et la disponibilité, Microsoft recommande d’utiliser les deux connexions d’un circuit ExpressRoute en mode actif-actif. En autorisant deux connexions à fonctionner dans ce mode, Microsoft équilibre la charge du trafic réseau entre les connexions par flux.

Diversité des couches physiques

Pour une meilleure résilience, envisagez d’établir plusieurs chemins entre la périphérie locale et les emplacements de peering (emplacements de périphérie du fournisseur/de Microsoft). Cette configuration peut être obtenue en utilisant différents fournisseurs de services ou en routant via un autre emplacement de peering à partir du réseau local. Pour une haute disponibilité, il est primordial de maintenir la redondance du circuit ExpressRoute dans l’architecture réseau de bout en bout. Cela inclut la maintenance de la redondance au sein de votre réseau local et la redondance au sein de votre fournisseur de services. Garantir la redondance dans ces parties de votre architecture signifie que vous ne devez pas avoir de point de défaillance unique.

Vérifier que la BFD (détection de transfert bidirectionnel) est activée et configurée

L’activation de la détection de transfert bidirectionnel (BFD) sur ExpressRoute peut accélérer la détection des défaillances de liaison entre les appareils MSEE et les routeurs sur lesquels votre circuit ExpressRoute est configuré. Microsoft recommande de configurer les appareils Customer Premises Edge (CPE) avec la BFD. ExpressRoute peut être configuré sur vos appareils de routage de périphérie ou sur vos appareils de routage Partner Edge. La BFD est activée par défaut sur les appareils MSEE côté Microsoft.

Recommandations en matière de passerelle ExpressRoute

Planifier la passerelle de réseau virtuel

Créez des passerelles de réseau virtuel redondantes interzone pour une plus grande résilience et planifiez les passerelles de réseau virtuel dans différentes régions pour la récupération d’urgence et la haute disponibilité. Lorsque vous utilisez des passerelles redondantes interzone, vous pouvez tirer parti de la résilience interzone pour accéder à vos services stratégiques et évolutifs sur Azure.

Migrer vers des passerelles ExpressRoute redondantes interzone

L’expérience de migration de passerelle guidée facilite votre migration d’une référence SKU non-Az vers une passerelle de référence SKU Az. Cette fonctionnalité permet la création d’une passerelle de réseau virtuel supplémentaire au sein du même sous-réseau de passerelle. Pendant le processus de migration, Azure transfère les configurations du plan de contrôle et des chemins de données de votre passerelle existante vers la nouvelle.

Recommandations en matière de récupération d’urgence et de haute disponibilité

Activer la haute disponibilité et la récupération d’urgence

Pour optimiser la disponibilité, les segments du fournisseur de services et des clients sur votre circuit ExpressRoute doivent être conçus pour la disponibilité et la résilience. Pour la récupération d’urgence, prévoyez des scénarios tels que les pannes de service régionales en raison de catastrophes naturelles. Implémentez une conception robuste de récupération d’urgence pour plusieurs circuits configurés via différents emplacements de peering dans différentes régions. Pour plus d’informations, consultez : Conception pour la récupération d’urgence.

Planifier la géo-redondance

Pour la planification de la récupération d’urgence, nous vous recommandons de configurer des circuits ExpressRoute dans plusieurs emplacements et régions de peering. Les circuits ExpressRoute peuvent être créés dans la même région métropolitaine ou dans différentes régions métropolitaines, et différents fournisseurs de services peuvent être utilisés pour différents chemins à travers chaque circuit. Les circuits ExpressRoute géoredondants sont utilisés pour créer une connectivité réseau backend robuste pour la récupération d’urgence. Pour en savoir plus, consultez Conception pour la haute disponibilité.

Remarque

L’utilisation d’un VPN site à site comme solution de secours pour la connectivité ExpressRoute n’est pas recommandée lorsqu’il s’agit de charges de travail stratégiques, sensibles à la latence ou gourmandes en bande passante. Dans ce cas, il est recommandé de concevoir la récupération d’urgence avec une résilience multisite ExpressRoute afin de garantir une disponibilité maximale.

Peering de réseaux virtuels pour la connectivité entre les réseaux virtuels

Le peering de réseaux virtuels (VNet) fournit une méthode plus efficace et directe, permettant aux services Azure de communiquer entre les réseaux virtuels sans avoir besoin d’une passerelle de réseau virtuel, d’un tronçon supplémentaire ou d’un transit via l’Internet public. Pour établir la connectivité entre des réseaux virtuels, le peering VNet doit être implémenté pour obtenir les meilleures performances possibles. Pour plus d’informations, consultez À propos du peering de réseaux virtuels et Gérer le peering VNet.

Recommandations en matière de surveillance et d’alerte

Configurer la surveillance et les alertes pour les circuits ExpressRoute

En tant que ligne de base, nous vous recommandons de configurer Network Insights dans Azure Monitor pour afficher toutes les métriques de circuit ExpressRoute, notamment ExpressRoute Direct et Global Reach. Dans la carte des circuits, vous pouvez visualiser des topologies et des dépendances pour les peerings, les connexions et les passerelles. Les insights disponibles pour les circuits incluent la disponibilité, le débit et les rejets de paquets.

Configurer des alertes d’intégrité de service pour les notifications de maintenance de circuit ExpressRoute

ExpressRoute utilise Azure Service Health pour vous informer de la maintenance planifiée et à venir des circuits ExpressRoute. Grâce à Service Health, vous pouvez afficher la maintenance planifiée et passée dans le portail Azure et configurer les alertes et les notifications qui répondent le mieux à vos besoins. Dans Service Health, vous pouvez voir la maintenance planifiée et les maintenances passées. Vous pouvez également définir des alertes dans Service Health pour être averti de la maintenance à venir.

Configurer le moniteur de connexion pour ExpressRoute

Le moniteur de connexion est une solution de monitoring réseau basée sur le cloud qui supervise la connectivité entre les déploiements cloud Azure et les emplacements locaux (filiales, etc.). Le moniteur de connexion est une solution basée sur un agent.

Configurer la surveillance de l’intégrité et les alertes de la passerelle

Configurez la surveillance à l’aide d’Azure Monitor pour la disponibilité, les performances et la scalabilité de la passerelle ExpressRoute. Lorsque vous déployez une passerelle ExpressRoute, Azure gère le calcul et les fonctions de votre passerelle. Plusieurs métriques de passerelle sont à votre disposition pour vous aider à mieux comprendre les performances de votre passerelle.