Herstel na noodgevallen op schaal instellen voor VMware-VM's/fysieke servers

Artikel
08/31/2023

In dit artikel wordt beschreven hoe u herstel na noodgevallen naar Azure instelt voor grote aantallen (>1000) on-premises VMware-VM's of fysieke servers in uw productieomgeving, met behulp van de Azure Site Recovery-service.

Uw BCDR-strategie definiëren

Als onderdeel van uw strategie voor bedrijfscontinuïteit en herstel na noodgevallen (BCDR) definieert u doelstellingen voor herstelpunten (RPO's) en RTO's (Recovery Time Objectives) voor uw zakelijke apps en workloads. RTO meet de duur van de tijd en het serviceniveau waarbinnen een zakelijke app of proces moet worden hersteld en beschikbaar moet zijn om continuïteitsproblemen te voorkomen.

Site Recovery biedt continue replicatie voor VMware-VM's en fysieke servers en een SLA voor RTO.
Bij het plannen van grootschalige noodherstel voor VMware-VM's en het bepalen van de Azure-resources die u nodig hebt, kunt u een RTO-waarde opgeven die wordt gebruikt voor capaciteitsberekeningen.

Aanbevolen procedures

Enkele algemene best practices voor grootschalige noodherstel. Deze best practices worden uitgebreid besproken in de volgende secties van het document.

Doelvereisten identificeren: maak een schatting van de capaciteits- en resourcebehoeften in Azure voordat u herstel na noodgevallen instelt.
Plannen voor Site Recovery onderdelen: bepaal welke Site Recovery onderdelen (configuratieserver, processervers) u nodig hebt om te voldoen aan uw geschatte capaciteit.
Een of meer uitschaalprocesservers instellen: gebruik niet de processerver die standaard wordt uitgevoerd op de configuratieserver.
De meest recente updates uitvoeren: het Site Recovery team brengt regelmatig nieuwe versies van Site Recovery onderdelen uit en zorg ervoor dat u de nieuwste versies gebruikt. U kunt hierbij helpen door bij te houden wat er nieuw is voor updates en updates in te schakelen en te installeren wanneer ze worden uitgebracht.
Proactief bewaken: wanneer u herstel na noodgevallen aan de gang krijgt, moet u proactief de status en status van gerepliceerde machines en infrastructuurresources bewaken.
Noodherstelanalyses: u moet regelmatig noodherstelanalyses uitvoeren. Deze hebben geen invloed op uw productieomgeving, maar helpen ervoor te zorgen dat failover naar Azure werkt zoals verwacht wanneer dat nodig is.

Informatie over capaciteitsplanning verzamelen

Verzamel informatie over uw on-premises omgeving om de behoeften van uw doelcapaciteit (Azure) te beoordelen en in te schatten.

Voer voor VMware de Deployment Planner voor VMware-VM's uit om dit te doen.
Voor fysieke servers moet u de informatie handmatig verzamelen.

De Deployment Planner voor VMware-VM's uitvoeren

De Deployment Planner helpt u bij het verzamelen van informatie over uw on-premises VMware-omgeving.

Voer de Deployment Planner uit tijdens een periode die het gebruikelijke verloop voor uw VM's vertegenwoordigt. Hierdoor worden nauwkeurigere schattingen en aanbevelingen gegenereerd.
U wordt aangeraden de Deployment Planner uit te voeren op de computer met de configuratieserver, omdat de planner de doorvoer berekent van de server waarop deze wordt uitgevoerd. Meer informatie over het meten van doorvoer.
Als u nog geen configuratieserver hebt ingesteld:
- Bekijk een overzicht van Site Recovery onderdelen.
- Stel een configuratieserver in om de implementatieplanner erop uit te voeren.

Voer vervolgens planner als volgt uit:

Meer informatie over de implementatieplanner. U kunt de nieuwste versie downloaden vanuit de portal of rechtstreeks downloaden.
Controleer de vereisten en meest recente updates voor de implementatieplanner en download en pak het hulpprogramma uit.
Voer de Deployment Planner uit op de configuratieserver.
Genereer een rapport om schattingen en aanbevelingen samen te vatten.
Analyseer de aanbevelingen en kostenramingen van het rapport.

Notitie

Het hulpprogramma is standaard geconfigureerd om te profileren en genereert een rapport voor maximaal 1000 VM's. U kunt deze limiet wijzigen door de sleutelwaarde MaxVMsSupported in het ASRDeploymentPlanner.exe.config-bestand te verhogen.

Vereisten en capaciteit voor het doel (Azure) plannen

Met behulp van uw verzamelde schattingen en aanbevelingen kunt u plannen voor doelresources en -capaciteit. Als u de Deployment Planner voor VMware-VM's hebt uitgevoerd, kunt u een aantal van de rapportaanbeveling gebruiken om u te helpen.

Compatibele VM's: gebruik dit nummer om het aantal VM's te identificeren dat gereed is voor herstel na noodgevallen naar Azure. Aanbevelingen over netwerkbandbreedte en Azure-kernen zijn gebaseerd op dit aantal.
Vereiste netwerkbandbreedte: let op de bandbreedte die u nodig hebt voor replicatie van verschillen van compatibele VM's.
- Wanneer u planner uitvoert, geeft u in enkele minuten de gewenste RPO op. In de aanbevelingen ziet u de bandbreedte die nodig is om 100% en 90% van de tijd aan die RPO te voldoen.
- De aanbevelingen voor netwerkbandbreedte houden rekening met de bandbreedte die nodig is voor het totale aantal configuratieservers en processervers dat in Planner wordt aanbevolen.
Vereiste Azure-kernen: noteer het aantal kernen dat u nodig hebt in de Azure-doelregio, op basis van het aantal compatibele VM's. Als u onvoldoende kernen hebt, kunt u bij failover Site Recovery de vereiste Azure-VM's niet maken.
Aanbevolen VM-batchgrootte: de aanbevolen batchgrootte is gebaseerd op de mogelijkheid om de initiële replicatie voor de batch standaard binnen 72 uur te voltooien, terwijl aan een RPO van 100% wordt opgegeven. De uurwaarde kan worden gewijzigd.

U kunt deze aanbevelingen gebruiken om Azure-resources, netwerkbandbreedte en VM-batchverwerking te plannen.

Azure-abonnementen en -quota plannen

We willen ervoor zorgen dat de beschikbare quota in het doelabonnement voldoende zijn om failover af te handelen.

Taak	Details	Actie
Kernen controleren	Als kernen in het beschikbare quotum niet gelijk zijn aan of groter zijn dan het totale doelaantal op het moment van failover, mislukken failovers.	Voor VMware-VM's controleert u of het doelabonnement voldoende kernen bevat om te voldoen aan de aanbeveling voor de implementatieplanner-kern. Voor fysieke servers controleert u of Azure-kernen voldoen aan uw handmatige schattingen. Als u de quota wilt controleren, klikt u in de Azure Portal >Abonnement op Gebruik en quota. Meer informatie over het verhogen van quota.
Failoverlimieten controleren	Het aantal failovers mag niet groter zijn dan Site Recovery failoverlimieten.	Als failovers de limieten overschrijden, kunt u abonnementen toevoegen en een failover uitvoeren naar meerdere abonnementen of het quotum voor een abonnement verhogen.

Failoverlimieten

De limieten geven het aantal failovers aan dat wordt ondersteund door Site Recovery binnen één uur, uitgaande van drie schijven per machine.

Wat betekent 'conform'? Als u een Virtuele Azure-machine wilt starten, moeten sommige stuurprogramma's de opstartstatus hebben en moeten services zoals DHCP worden ingesteld op automatisch starten.

Machines die aan deze instellingen voldoen, hebben deze instellingen al.
Voor computers met Windows kunt u de naleving proactief controleren en ze zo nodig compatibel maken. Meer informatie.
Linux-machines worden alleen in overeenstemming gebracht op het moment van failover.

Voldoet de machine aan Azure?	Limieten voor Azure-VM's (failover van beheerde schijf)
Yes	2000
No	1000

Bij limieten wordt ervan uitgegaan dat er minimaal andere taken worden uitgevoerd in de doelregio voor het abonnement.
Sommige Azure-regio's zijn kleiner en hebben mogelijk iets lagere limieten.

Infrastructuur en VM-connectiviteit plannen

Na een failover naar Azure moeten uw workloads op dezelfde manier werken als on-premises en moeten gebruikers toegang krijgen tot workloads die worden uitgevoerd op de Azure-VM's.

Meer informatie over failover van uw on-premises Active Directory- of DNS-infrastructuur naar Azure.
Meer informatie over het voorbereiden van verbinding met Azure-VM's na een failover.

Plannen voor broncapaciteit en vereisten

Het is belangrijk dat u over voldoende configuratieservers en uitschaalprocesservers beschikt om te voldoen aan de capaciteitsvereisten. Wanneer u begint met de grootschalige implementatie, begint u met één configuratieserver en één uitschaalprocesserver. Wanneer u de voorgeschreven limieten bereikt, voegt u extra servers toe.

Notitie

Voor VMware-VM's doet de Deployment Planner enkele aanbevelingen over de configuratie- en processervers die u nodig hebt. U wordt aangeraden de tabellen in de volgende procedures te gebruiken in plaats van de aanbeveling van Deployment Planner te volgen.

Een configuratieserver instellen

De capaciteit van de configuratieserver wordt beïnvloed door het aantal machines dat repliceert en niet door het gegevensverloop. Gebruik deze gedefinieerde VM-limieten om erachter te komen of u extra configuratieservers nodig hebt.

CPU	Geheugen	Cacheschijf	Limiet voor gerepliceerde machines
8 vCPU's 2 sockets * 4 kernen bij 2,5 Ghz	16 GB	600 GB	Maximaal 550 machines Hierbij wordt ervan uitgegaan dat elke machine drie schijven van elk 100 GB heeft.

Deze limieten zijn gebaseerd op een configuratieserver die is ingesteld met behulp van een OVF-sjabloon.
Bij de limieten wordt ervan uitgegaan dat u niet de processerver gebruikt die standaard wordt uitgevoerd op de configuratieserver.

Als u een nieuwe configuratieserver wilt toevoegen, volgt u deze instructies:

Stel een configuratieserver in voor herstel na noodgevallen van VMware-VM's met behulp van een OVF-sjabloon.
Stel handmatig een configuratieserver in voor fysieke servers of voor VMware-implementaties die geen OVF-sjabloon kunnen gebruiken.

Houd er bij het instellen van een configuratieserver rekening mee dat:

Wanneer u een configuratieserver instelt, is het belangrijk om rekening te houden met het abonnement en de kluis waarin deze zich bevindt, omdat deze na de installatie niet mogen worden gewijzigd. Als u de kluis moet wijzigen, moet u de configuratieserver loskoppelen van de kluis en deze opnieuw registreren. Hierdoor wordt de replicatie van VM's in de kluis gestopt.
Als u een configuratieserver met meerdere netwerkadapters wilt instellen, moet u dit doen tijdens het instellen. U kunt dit niet doen nadat de configuratieserver in de kluis is geregistreerd.

Een processerver instellen

De capaciteit van de processerver wordt beïnvloed door gegevensverloopsnelheden en niet door het aantal computers dat is ingeschakeld voor replicatie.

Voor grote implementaties moet u altijd ten minste één uitschaalprocesserver hebben.
Gebruik de volgende tabel om erachter te komen of u extra servers nodig hebt.
U wordt aangeraden een server met de hoogste specificatie toe te voegen.

CPU	Geheugen	Cacheschijf	Verloop
12 vCPU's 2 sockets*6 kernen bij 2,5 Ghz	24 GB	1 TB	Maximaal 2 TB per dag

Stel de processerver als volgt in:

Controleer de vereisten.
Installeer de server in de portal of vanaf de opdrachtregel.
Gerepliceerde machines configureren voor het gebruik van de nieuwe server. Als u al machines hebt die worden gerepliceerd:
- U kunt een volledige processerverworkload verplaatsen naar de nieuwe processerver.
- U kunt ook specifieke VM's verplaatsen naar de nieuwe processerver.

Grootschalige replicatie inschakelen

Nadat u capaciteit hebt gepland en de vereiste onderdelen en infrastructuur hebt geïmplementeerd, schakelt u replicatie in voor grote aantallen VM's.

Machines sorteren in batches. U schakelt replicatie in voor VM's binnen een batch en gaat vervolgens verder met de volgende batch.
- Voor VMware-VM's kunt u de aanbevolen VM-batchgrootte gebruiken in het rapport Deployment Planner.
- Voor fysieke machines raden we u aan batches te identificeren op basis van computers met een vergelijkbare grootte en hoeveelheid gegevens, en op basis van beschikbare netwerkdoorvoer. Het doel is machines die waarschijnlijk hun initiële replicatie in ongeveer dezelfde tijd zullen voltooien.
Als het schijfverloop voor een computer hoog is of de limieten overschrijdt in Deployment thePlanner, kunt u niet-kritieke bestanden die u niet hoeft te repliceren (zoals logboekdumps of tijdelijke bestanden) van de computer verplaatsen. Voor VMware-VM's kunt u deze bestanden naar een afzonderlijke schijf verplaatsen en die schijf vervolgens uitsluiten van replicatie.
Voordat u replicatie inschakelt, controleert u of machines voldoen aan de replicatievereisten.
Configureer een replicatiebeleid voor VMware-VM's of fysieke servers.
Schakel replicatie in voor VMware-VM's of fysieke servers. Hiermee wordt de initiële replicatie voor de geselecteerde machines gestart.

Uw implementatie bewaken

Nadat u de replicatie voor de eerste batch virtuele machines hebt gestart, begint u uw implementatie als volgt te bewaken:

Wijs een beheerder voor herstel na noodgevallen toe om de status van gerepliceerde machines te bewaken.
Gebeurtenissen voor gerepliceerde items en de infrastructuur bewaken.
Controleer de status van uw uitschaalprocesservers.
Meld u aan om e-mailmeldingen voor gebeurtenissen te ontvangen, voor eenvoudigere controle.
Voer regelmatig herstelanalyses uit om ervoor te zorgen dat alles werkt zoals verwacht.

Grootschalige failovers plannen

In geval van nood moet u mogelijk een failover uitvoeren voor een groot aantal machines/workloads naar Azure. Bereid u als volgt voor op dit type gebeurtenis.

U kunt zich als volgt voorbereiden op een failover:

Bereid uw infrastructuur en VM's voor zodat uw workloads na een failover beschikbaar zijn en zodat gebruikers toegang hebben tot de Azure-VM's.
Let op de failoverlimieten eerder in dit document. Zorg ervoor dat uw failovers binnen deze limieten vallen.
Voer regelmatig noodherstelanalyses uit. Drills helpen bij het volgende:
- Zoek hiaten in uw implementatie vóór failover.
- Maak een schatting van de end-to-end-RTO voor uw apps.
- Maak een schatting van de end-to-end-RPO voor uw workloads.
- Ip-adresbereikconflicten identificeren.
- Wanneer u drills uitvoert, raden we u aan geen productienetwerken te gebruiken voor drills en testfailovers na elke analyse op te schonen.

Als u een grootschalige failover wilt uitvoeren, raden we het volgende aan:

Maak herstelplannen voor workloadfailover.
- Elk herstelplan kan een failover van maximaal 100 machines activeren.
- Meer informatie over herstelplannen.
Voeg Azure Automation runbookscripts toe aan herstelplannen om handmatige taken in Azure te automatiseren. Typische taken zijn het configureren van load balancers, het bijwerken van DNS, enzovoort. Meer informatie
Vóór failover moet u Windows-machines zo voorbereiden dat ze voldoen aan de Azure-omgeving. Failoverlimieten zijn hoger voor computers die voldoen. Meer informatie over runbooks.
Trigger failover met de PowerShell-cmdlet Start-AzRecoveryServicesAsrPlannedFailoverJob , samen met een herstelplan.

Volgende stappen

Site Recovery bewaken