Suivre l'intégrité de votre solution de récupération d'urgence avec Log Analytics

Publié le 29 août, 2019

Program Manager II, R&D Compute MDR IDC (Hyd)

Une fois Azure Site Recovery adopté, la supervision de la configuration peut se révéler très complexe. Vous devez veiller à ce que la réplication de toutes les instances protégées se poursuive et à ce que les machines virtuelles soient toujours prêtes pour le basculement. Bien qu'Azure Site Recovery réponde à ces besoins en fournissant l'état de l'intégrité à un moment donné, des alertes d'intégrité actives et les tendances des 72 dernières heures, plusieurs heures de travail sont encore nécessaires pour suivre et analyser ces signaux. Le problème s'aggrave lorsque le nombre d'instances protégées augmente. Lorsque les machines virtuelles se comptent par centaines, l'intervention d'une équipe d'opérateurs de récupération d'urgence est souvent nécessaire.

En consultant différents forums de commentaires, nous nous sommes rendu compte que les clients recevaient trop d'alertes. Et même avec ces alertes, les actions correctives à long terme étaient difficiles à identifier en raison de l'absence de volet unique permettant d'examiner les données historiques. Les clients nous ont fait part de la nécessité de suivre diverses métriques, comme l'intégrité des objectifs de point de récupération (RPO) au fil du temps, le taux de modifications des données (évolution) des disques des machines au fil du temps, l'état actuel de la machine virtuelle et l'état du test de basculement, entre autres exigences de base. Il est également important que les clients soient avertis des alertes en fonction des besoins de votre entreprise en matière de continuité d'activité et de reprise d'activité.

Solution intégrée avec journaux Azure Monitor et Log Analytics

Azure Site Recovery vous fournit une solution intégrée de supervision et d'alertes avancées qui repose sur les journaux Azure Monitor. Vous pouvez maintenant envoyer les journaux de diagnostic du coffre Site Recovery vers un espace de travail de Log Analytics. Les journaux, également appelés journaux Azure Monitor, sont aujourd'hui visibles dans le panneau Créer un paramètre de diagnostic.

Les journaux sont générés pour les Machines virtuelles Azure, ainsi que pour toutes les machines VMware ou physiques protégées par Azure Site Recovery.

Paramètres de diagnostic

Dès que les données commencent à être introduites dans l'espace de travail, les journaux peuvent être interrogés à l'aide du langage de requête Kusto afin de générer des tendances historiques, des captures instantanées ponctuelles, ainsi que des tableaux de bord de récupération d'urgence de niveaux administrateur et exécutif pour bénéficier d'une vue d'ensemble. Les données peuvent être introduites dans un espace de travail à partir de plusieurs coffres Site Recovery. Vous trouverez ci-dessous quelques exemples de cas d'usage qui peuvent être résolus à l'aide de cette intégration :

  • Capture instantanée de l'intégrité de la réplication de toutes les instances protégées sous forme de graphique à secteurs
  • Tendance relative au RPO d'une instance protégée au fil du temps
  • Tendance relative au taux de modifications des données de tous les disques d'une instance protégée au fil du temps
  • Capture instantanée de l'état du test de basculement de toutes les instances protégées sous forme de graphique à secteurs
  • Vue récapitulative semblable à celle du panneau Eléments répliqués
  • Alerte si l'état de plus de 50 instances protégées devient critique
  • Alerte si le RPO dépasse les 30 minutes pour plus de 50 instances protégées
  • Alerte si le dernier exercice de récupération d'urgence remonte à plus de 90 jours
  • Alerte en cas d'échec d'un type particulier de travail Site Recovery

Exemples de cas d'usage

Exemples de cas d'usage

Ce ne sont là que quelques exemples. Pour obtenir plus d'exemples de ce type, consultez la documentation « Superviser Site Recovery avec les journaux Azure Monitor ». Des solutions de tableau de bord peuvent également être créées sur ces données pour personnaliser la supervision de votre configuration de récupération d'urgence. Voici un exemple de tableau de bord :

Solution de tableau de bord dans Log Analytics

Azure vous fournit en mode natif la haute disponibilité et la fiabilité dont vos charges de travail stratégiques ont besoin. Et vous pouvez choisir d'améliorer votre protection et de vous conformer aux exigences de conformité à l'aide de la solution de récupération d'urgence fournie par Azure Site Recovery. La prise en main d'Azure Site Recovery est simple. Consultez les informations de tarification et inscrivez-vous pour bénéficier d'un essai gratuit de Microsoft Azure. Vous pouvez également visiter le forum Azure Site Recovery sur MSDN pour plus d'informations et pour dialoguer avec d'autres clients.