Configuration d'un plan de reprise d'activité avec Metro

Mise en oeuvre de Metro pour un plan de reprise d'activité

Dernière mise à jour le 15/11/2022

Objectif

Ce guide vous présente Metro Availability qui permet un plan de reprise d'activité automatisé.

OVHcloud vous met à disposition des services dont la configuration, la gestion et la responsabilité vous incombent. Il vous appartient donc de ce fait d’en assurer le bon fonctionnement.

Ce guide a pour but de vous accompagner au mieux sur des tâches courantes. Néanmoins, nous vous recommandons de faire appel à un prestataire spécialisé si vous éprouvez des difficultés ou des doutes concernant l’administration, l’utilisation ou la mise en place d’un service sur un serveur.

Prérequis

  • Être connecté à votre espace client OVHcloud.
  • Être connecté sur vos clusters via Prism Central.
  • Avoir 3 clusters Nutanix au sein de l'infrastructure OVHcloud avec des licences Pack Advanced si vous avez une offre packagée sur les deux clusters du P.R.A. Ces 3 clusters devront être sur des sites distants pour obtenir un maximum de sûreté.
  • Avoir une latence de moins de 5 ms entre les deux clusters répliqués.

Présentation

Nous allons mettre en place un plan de reprise d'activité bidirectionnel entre deux clusters avec ce matériel :

  • Un cluster Nutanix à Roubaix en France avec des machines virtuelles répliquées à Gravelines.
  • Un cluster Nutanix à Gravelines en France avec des machines virtuelles répliquées à Roubaix.
  • Un cluster Nutanix à Erith en Angleterre avec Prism Central qui servira de témoin dans le plan de reprise d'activité.

Nous n'utiliserons qu'un seul vRack qui contiendra :

  • Les trois clusters Nutanix.
  • Les load balancers.
  • Les adresses IP additionnelles sur le rtvRack.

Vous trouverez ci-dessous le schéma représentant les trois sites :

00 - Metro Availability Diagram 01

En pratique

Nous allons mettre en place ce P.R.A (Plan de reprise d'activité) étape par étape.

Les informations de configuration des clusters utilisées par notre guide sont les suivantes :

  • Cluster de Roubaix :

    • Serveur 1 : adresse VM CVM 192.168.0.21, adresse IP hyperviseur AHV 192.168.0.1.
    • Serveur 2 : adresse VM CVM 192.168.0.22, adresse IP hyperviseur AHV 192.168.0.2.
    • Serveur 3 : adresse VM CVM 192.168.0.23, adresse IP hyperviseur AHV 192.168.0.3.
    • Adresse virtuelle de Prism Element : 192.168.0.100.
    • Adresse iSCSI de Prism Element : 192.168.0.102.
    • Adresse IP Prism Central : 192.168.0.101.
    • Passerelle : 192.168.3.254.
    • Masque : 255.255.252.0
    • Version du cluster : 6.5
  • Cluster de Gravelines :

    • Serveur 1 : adresse VM CVM 192.168.1.21, adresse IP hyperviseur AHV 192.168.1.1.
    • Serveur 2 : adresse VM CVM 192.168.1.22, adresse IP hyperviseur AHV 192.168.1.2.
    • Serveur 3 : adresse VM CVM 192.168.1.23, adresse IP hyperviseur AHV 192.168.1.3.
    • Adresse virtuelle de Prism Element : 192.168.1.100.
    • Adresse iSCSI de Prism Element : 192.168.1.102.
    • Adresse IP Prism Central : 192.168.1.101.
    • Passerelle : 192.168.3.254.
    • Masque : 255.255.252.0
    • Version du cluster : 6.5.
  • Cluster d'Erith :

    • Serveur 1 : adresse VM CVM 192.168.2.21, adresse IP hyperviseur AHV 192.168.2.1.
    • Serveur 2 : adresse VM CVM 192.168.2.22, adresse IP hyperviseur AHV 192.168.2.2.
    • Serveur 3 : adresse VM CVM 192.168.2.23, adresse IP hyperviseur AHV 192.168.2.3.
    • Adresse virtuelle de Prism Element : 192.168.2.101.
    • Adresse iSCSI de Prism Element : 192.168.2.102.
    • Adresse IP Prism Central : 192.168.2.100.
    • Passerelle : 192.168.3.254.
    • Masque : 255.255.252.0
    • Version du cluster : 6.5.

En plus de ce guide, vous pouvez vous aider de ces documentations :

Etape 1 - Configuration

Etape 1.1 - Interconnexion des trois clusters

La première étape est de réaliser l'interconnexion des trois clusters sur le même vRack OVHcloud.

Aidez-vous de ce guide pour interconnecter vos clusters : Interconnexion de clusters au travers du vRack. Pour connecter les trois clusters,utilisez les instructions fournies sur le guide dans ce sens :

  • Les clusters de Roubaix dans le vRack dédié à Gravelines.
  • Les clusters de Erith dans le vRack dédié à Gravelines.

Lorsque vous aurez terminé la configuration, vous aurez dans votre vRack ces éléments :

  • 9 serveurs dédiés (3 par cluster)
  • 3 adresses IP publiques
  • 3 Load Balancers

01 - vRack Configuration 01

Les trois clusters sont pour l'instant accessibles à partir de l'URL Prism Central de chaque cluster.

Etape 1.2 - Suppression des enregistrements Prism Central pour les clusters de Roubaix et Gravelines

Pour pouvoir mettre en place une solution de plan de reprise d'activité avec Metro Availability, il faut un témoin de cluster qui assure l'automatisation des tâches en cas d'indisponibilité d'un des clusters. Le témoin de cluster se trouve sur une machine virtuelle Prism Central.

Le cluster d'Erith hébergera la machine virtuelle Prism Central pour les trois clusters et servira de témoin de clusters pour le plan de reprise d'activité entre Roubaix et Gravelines.

Désactivation de Prism Central sur le cluster de Roubaix

Connectez-vous en SSH au cluster Prism Element de Roubaix :

ssh nutanix@adresse_ip_privee_prism_element_Roubaix
Saisissez le mot de passe de Prism Element

Exécutez cette commande pour retirer Prism Element de la configuration de Prism Central :

ncli multicluster remove-from-multicluster external-ip-address-or-svm-ips=adresse_ip_privee_prism_central_roubaix\
username=admin password=mdp_pe_Roubaix force=true

Ce message apparait lors de la déconnexion à Prism Central.

Cluster unregistration is currently in progress. This operation may take a while.

Saisissez cette commande :

ncli cluster info

Notez la valeur du Cluster UUID qui doit avoir cette forme xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx.

Déconnectez-vous de Prism Element et connectez-vous en SSH sur la machine virtuelle Prism Central de Roubaix.

ssh nutanix@adresse_ip_privee_prism_central_roubaix
Saisissez le mot de passe de Prism Central

Saisissez cette commande :

python /home/nutanix/bin/unregistration_cleanup.py cluster_uuid_prism_element_Roubaix
Désactivation de Prism Central sur le cluster de Gravelines

Connectez-vous en SSH au cluster Prism Element de Gravelines.

ssh nutanix@adresse_ip_prism_element_Gravelines
Saisissez le mot de passe de Prism Element

Saisissez cette commande :

ncli multicluster remove-from-multicluster external-ip-address-or-svm-ips=adresse_ip_privee_prism_central_Gravelines\
username=admin password=mdp_pe_Gravelines force=true

Ce message apparait lors de la déconnexion à Prism Central.

Cluster unregistration is currently in progress. This operation may take a while.

Saisissez cette commande :

ncli cluster info

Notez la valeur de Cluster UUID qui doit avoir cette forme xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx

Déconnectez-vous de Prism Element et connectez-vous en SSH sur la machine virtuelle Prism Central de Gravelines.

ssh nutanix@adresse_ip_privee_prism_central_Gravelines
saisissez le mot de passe de Prism Central
python /home/nutanix/bin/unregistration_cleanup.py cluster_uuid_prism_element_Gravelines

Etape 1.3 - Enregistrement des deux clusters sur le Prism Central d'Erith

Connectez-vous en SSH sur Prism Element de Roubaix :

ssh nutanix@adresse_ip_privee_prism_element_Roubaix
saisissez le mot de passe de Prism Element

Exécutez cette commande :

ncli multicluster register-to-prism-central username=admin password=passwod_admin\ external-ip-address-or-svm-ips=adresse_ip_privee_prism_central_Erith

Ce message apparait :

Cluster registration is currently in progress. This operation may take a while.

Patientez et saisissez cette commande :

ncli multicluster get-cluster-state

Si le cluster est bien connecté à Prism Central d'Erith, vous verrez apparaître ces informations :

Registered Cluster Count: 1

    Cluster Id                : xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx
    Cluster Name              : Prism-Central-Erith-FQDN
    Is Multicluster           : true
    Controller VM IP Addre... : [adresse_ip_privee_prism_central_Erith]
    External or Masqueradi... :
    Cluster FQDN              :
    Controller VM NAT IP A... :
    Marked for Removal        : false
    Remote Connection Exists  : true

Connectez-vous en SSH sur Prism Element de Gravelines :

ssh nutanix@adresse_ip_prism_element_Gravelines
Saisissez le mot de passe de Prism Element de Gravelines

Exécutez cette commande :

ncli multicluster register-to-prism-central username=admin password=passwod_admin_Erith external-ip-address-or-svm-ips=adresse_ip_privee_prism_central_Erith

Ce message apparaît :

Cluster registration is currently in progress. This operation may take a while.

Patientez et saisissez cette commande :

ncli multicluster get-cluster-state

Si le cluster est bien connecté au Prism Central d'Erith, vous verrez appparaitre ces informations :

Registered Cluster Count: 1

    Cluster Id                : xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx
    Cluster Name              : Prism-Central-Erith-FQDN
    Is Multicluster           : true
    Controller VM IP Addre... : [adresse_ip_privee_prism_central_Erith]
    External or Masqueradi... :
    Cluster FQDN              :
    Controller VM NAT IP A... :
    Marked for Removal        : false
    Remote Connection Exists  : true

A partir d'un navigateur web, connectez-vous sur l'URL de Prism-Central à Erith, vous verrez les trois clusters.

02 - Prism Central Dashboard 01

Les machines virtuelles Prism Central de Gravelines et Roubaix ne servent plus, vous pouvez les arrêter.

Via le menu principal, cliquez sur Vms dans le sous-menu Compute & Storage.

02b - Shutdow Prism Central Gravelines Roubaix 01

Sélectionnez les machines virtuelles de Prism Central de Gravelines et Roubaix et cliquez sur Guest Shutdown à partir du menu Actions.

02b - Shutdow Prism Central Gravelines Roubaix 02

Etape 1.4 - Ajout des adresses IP pour les connexions iSCSI sur les trois clusters

A partir du tableau de bord Prism Central, cliquez sur le lien vers le cluster d'Erith.

03 - Add iscsi address Erith 01

Sur le tableau de bord de Prism Element, cliquez en haut à gauche sur le nom du cluster.

03 - Add iscsi address Erith 02

Faites défilez la fenêtre, ajoutez une adresse IP non utilisée à ISCSI Data Services IP et cliquez sur Save.

03 - Add iscsi address Erith 03

A partir du tableau de bord Prism Central, cliquez sur le lien vers le cluster de Gravelines.

03 - Add iscsi address Gravelines 01

Sur le tableau de bord de Prism Element, cliquez en haut à gauche sur le nom du cluster.

03 - Add iscsi address Gravelines 02

Faites défiler la fenêtre, ajoutez une adresse IP non utilisée à ISCSI Data Services IP et cliquez sur Save.

03 - Add iscsi address graveline 03

A partir du tableau de bord Prism Central, cliquez sur le lien vers le cluster de Roubaix.

03 - Add iscsi address Roubaix 01

Sur le tableau de bord de Prism Element, cliquez en haut à gauche sur le nom du cluster.

03 - Add iscsi address Roubaix 02

Faites défilez la fenêtre, ajoutez une adresse IP non utilisée à ISCSI Data Services IP et cliquez sur Save.

03 - Add iscsi address Roubaix 03

Etape 1.5 - Création de deux Storage Containers

Nous allons créer deux Storage Containers portant le même nom, un à Roubaix et l'autre à Gravelines.

Depuis le menu principal de Prism Element, cliquez sur Storage Containers dans le sous-menu Compute & Storage.

05 - Add-storage-container 01

Cliquez sur Create Storage Container.

05 - Add-storage-container 02

Saisissez UsedForDR dans Name, choisissez le cluster de Roubaix dans Cluster et cliquez sur Create.

05 - Add-storage-container 03

Cliquez sur Create Storage Container.

05 - Add-storage-container 04

Saisissez UsedForDR dans Name, choisissez le cluster de Gravelines dans Cluster et cliquez sur Create.

05 - Add-storage-container 05

Dans la liste des Storages Containers, vous verrez deux Storage Containers portant le même nom. Un sur le cluster de Roubaix et l'autre sur le cluster de Gravelines.

05 - Add-storage-container 06

Etape 1.6 - Déplacement des machines virtuelles dans le Storage Container

Nous allons déplacer le stockage des machines virtuelles sur les Storage Container que nous avons créé.

Connectez-vous en SSH sur Prism Element du cluster de Roubaix :

ssh nutanix@adresse_ip_privee_Prism_element_Roubaix
Saisissez le mot de passe du compte Nutanix de Prism Element

Exécutez cette commande pour chaque VM que nous allons déplacer dans le Storage Container, en remplaçant nomvm par le nom de la machine virtuelle (dans notre plan de reprise d'activité, nous avons deux machines virtuelles à Roubaix, une sous Windows et une autre sous Linux).

acli vm.update_container nomvm container=UsedForDR
Saisissez le mot de passe du compte Nutanix de Prism Element

Connectez-vous en SSH sur Prism Element du cluster de Gravelines :

ssh nutanix@adresse_ip_privee_Prism_element_Gravelines
Saisissez le mot de passe du compte Nutanix de Prism Element

Exécutez cette commande pour chaque VM que nous allons déplacer dans le Storage Container, en remplaçant nomvm par le nom de la machine virtuelle (dans notre plan de reprise d'activité, nous avons trois machines virtuelles à Gravelines, une sous Windows, une autre sous Linux ainsi que la gateway qui donne accès à Internet).

acli vm.update_container nomvm container=UsedForDR
Saisissez le mot de passe du compte Nutanix de Prism Element

Etape 1.7 - Création d'une catégorie qui servira lors de la mise en place du P.R.A

Nous allons créer une catégorie avec deux valeurs dans Prism Central pour affectuer les machines virtuelles concernées par la réplication.

Faites défiler le menu principal, cliquez sur Categories dans le sous menu Administration.

06 - Add Categorie 01

Cliquez sur New Category.

06- Add Categorie 02

Saisissez Protected VM dans Name, ajoutez les valeurs Roubaix et Gravelines dans Values et cliquez ensuite sur Save.

06 - Add Categorie 03

La catégorie apparait dans la liste et elle est prête à être utilisée.

06 - Add Categorie 04

Etape 1.8 - Ajout des machines virtuelles dans les catégories

Nous allons affecter deux machines virtuelles sur le cluster de Roubaix dans une catégorie et trois machines virtuelles sur le cluster de Gravelines dans une autre catégorie.

Via le menu principal de Prism Central, cliquez sur Vms dans le sous menu Compute & Storage.

07 - Add Categorie to VM Roubaix 01

Sélectionnez à gauche les deux machines virtuelles de Roubaix puis, dans le menu Actions, cliquez sur Manage Categories.

07 - Add Categorie to VM Roubaix 02

Ajoutez la catégorie ProcectedVM: Roubaix, cliquez ensuite sur Save.

07 - Add Categorie to VM Roubaix 03

Sélectionnez à gauche les trois machines virtuelles de Gravelines et, dans le menu Actions, cliquez sur Manage Categories.

08 - Add Categorie to VM Gravelines 01

Ajoutez la catégorie ProcectedVM: Gravelines, cliquez ensuite sur Save.

08 - Add Categorie to VM Gravelines 02

Etape 1.9 - Mise en place des réplications synchrones entre Roubaix et Gravelines

La réplication synchrone permet une réplication permanente avec 0 secondes de pertes de données.

Mise en place de réplication entre Roubaix et Gravelines

Dans le menu principal de Prism Central, cliquez sur Protection Policies dans le sous menu Data Protection.

09 - Create Protection Policy Roubaix 01

Cliquez sur Create Protection Policy.

09 - Create Protection Policy Roubaix 02

Saisissez ROUBAIX-TO-GRAVELINES dans Policy name, gardez Local AZ et cliquez sur Select Cluster dans Primary Location.

09 - Create Protection Policy Roubaix 03

Choisissez le cluster de Roubaix et cliquez sur Save.

09 - Create Protection Policy Roubaix 04

En haut à gauche à coté de Disaster Recovery, cliquez sur Enable.

09 - Create Protection Policy Roubaix 05

Le système contrôle que tout est correct avant d'activer l'option Disaster Recovery.

09 - Create Protection Policy Roubaix 06

Cliquez sur Enable pour activer l'option Disaster Recovery.

09 - Create Protection Policy Roubaix 07

Cliquez à nouveau sur Enable.

09 - Create Protection Policy Roubaix 07

L'activation de l'option Disaster Recovery est en cours.

Garder Local AZ, sélectionnez le cluster dans Recovery Location et cliquez sur Save.

09 - Create Protection Policy Roubaix 08

Cliquez sur + Add Schedule.

09 - Create Protection Policy Roubaix 10

Choisissez les options Synchronous pour Protection Type et Automatic pour Failure Detection Mode. Cliquez ensuite sur Save Schedule.

09 - Create Protection Policy Roubaix 11

Cliquez sur Next.

09 - Create Protection Policy Roubaix 12

Sélectionnez la catégorie ProtectedVM : Roubaix et cliquez sur Add.

09 - Create Protection Policy Roubaix 13

Cliquez sur Create.

09 - Create Protection Policy Roubaix 14

Les machines virtuelles de Roubaix sont à présent répliquées vers Gravelines. Il faut attendre une première réplication complète pour avoir une réplication permanente.

09 - Create Protection Policy Roubaix 15

Mise en place de réplication entre Gravelines et Roubaix

La réplication peut être bidirectionnelle, nous allons maintenant créer une réplication de Gravelines vers Roubaix.

Cliquez sur Create Protection Policy.

10 - Create Protection Policy Gravelines 01

Choisissez comme nom GRAVELINES-TO-ROUBAIX dans Policy Name, gardez Local AZ et choisissez le cluster de Gravelines dans Primary Location. Cliquez ensuite sur Save.

10 - Create Protection Policy Gravelines 02

Conservez Local AZ, sélectionnez le cluster de Roubaix et cliquez sur Save.

10 - Create Protection Policy Gravelines 03

Cliquez sur + Add Schedule.

10 - Create Protection Policy Gravelines 04

Choisissez les options Synchronous pour Protection Type et Automatic pour Failure Detection Mode. Cliquez ensuite sur Save Schedule.

10 - Create Protection Policy Gravelines 05

Cliquez sur Next.

10 - Create Protection Policy Gravelines 06

Sélectionnez la catégorie ProtectedVM : Gravelines et cliquez sur Add.

10 - Create Protection Policy Gravelines 07

Cliquez sur Create.

10 - Create Protection Policy Gravelines 08

Une deuxième stratégie de protection est en place.

10 - Create Protection Policy Gravelines 09

Etape 1.10 - Création de sous-réseaux nécessaires au plan de reprise d'activité

Nous allons créer des sous-réseaux qui serviront pour les tests des plans de reprises d'activité.

Pour chaque sous-réseau existant, il est nécessaire d'avoir un réseau de test. Sur les deux clusters du plan de reprise d'activité, nous avons trois sous-réseaux de production.

  • base sur le VLAN 0.
  • infra sur le VLAN 1.
  • production sur le VLAN 2.

Nous allons donc créer 3 sous-réseaux supplémentaires sur les clusters de Gravelines et de Roubaix avec ces noms :

  • testbase sur le VLAN 100.
  • testinfra sur le VLAN 101.
  • production sur le VLAN 102.

Aidez-vous de ce guide pour créer des VLAN sur vos clusters Nutanix : isoler les machines de gestion de la production.

Dans le tableau de bord Subnets de Prism Central, vous verrez six nouveaux sous-réseaux.

11 - Create Test Subnet 01

Etape 1.11 - Mise en place des plans de reprises d'activités

Maintenant que les réplications et les sous-réseaux sont en place, nous allons mettre en œuvre des plans de reprise d'activité automatisés ou manuels à la demande pour :

  • migrer des machines virtuelles à chaud entre les deux clusters ;
  • tester que la réplication fonctionne correctement ;
  • redémarrer automatiquement les machines virtuelles membres du P.R.A en cas de défaillance d'un deux clusters.
Création du plan de reprise d'activité pour le cluster de Roubaix

Dans le menu principal de Prism Central, cliquez sur Recovery Plans dans le sous-menu Data Protection.

12 - Create Recovery Plan Roubaix 01

Cliquez à Gauche sur Enable Disaster Recovery.

12 - Create Recovery Plan Roubaix 02

Normalement le plan de de reprise doit être activé comme indiqué avec le message Disaster Recovery enabled. Cliquez sur la à droite pour fermer cette fenêtre.

12 - Create Recovery Plan Roubaix 03

Cliquez sur Create New Recovery Plan.

12 - Create Recovery Plan Roubaix 04

Choisissez ces informations :

  • Recovery Plan Name : Recovery VM from ROUBAIX to GRAVELINES.

  • Primary Location : Local AZ.

  • Primary Cluster : cluster de Roubaix.

  • Recovery Location : Local AZ.

  • Recovery Cluster : cluster de Gravelines.

  • Failure Execution Mode : Automatic.

  • Execute failover after disconnectivity of : 30 seconds.

Cliquez ensuite sur Next.

12 - Create Recovery Plan Roubaix 05

Cliquez sur + Add VM(s).

12 - Create Recovery Plan Roubaix 06

Sélectionnez les deux machines virtuelles et cliquez sur Add.

12 - Create Recovery Plan Roubaix 07

Cliquez sur Next.

12 - Create Recovery Plan Roubaix 08

Cliquez sur OK. Got it.

12 - Create Recovery Plan Roubaix 09

Cliquez sur Stretch networks.

12 - Create Recovery Plan Roubaix 10

Cliquez sur Proceed.

12 - Create Recovery Plan Roubaix 11

Choisissez les VLAN qui seront utilisés lors du P.R.A comme ceci :

  • Primary
    • Production : production
    • Test Failback : testproduction
  • Recovery
    • Production : production
    • Test Failback : testproduction

Cliquez ensuite sur Done.

12 - Create Recovery Plan Roubaix 12

Création du plan de reprise d'activité pour le cluster de Roubaix

Le plan de reprise d'activité est créé pour le site de Roubaix. Cliquez sur Create Recovery Plan pour créer le plan de reprise d'activité de Gravelines.

12 - Create Recovery Plan Roubaix 13

Choisissez ces informations :

  • Recovery Plan Name : Recovery VM from Gravelines to Roubaix.

  • Primary Location: Local AZ.

  • Primary Cluster: cluster de Gravelines.

  • Recovery Location: Local AZ.

  • Recovery Cluster: cluster de Roubaix.

  • Failure Execution Mode : Automatic.

  • Execute failover after disconnectivity of : 30 seconds.

Cliquez ensuite sur Next.

13 - Create Recovery Plan Gravelines 01

Cliquez sur + Add VM(s).

13 - Create Recovery Plan Gravelines 02

Sélectionnez les trois machines virtuelles et cliquez sur Add.

13 - Create Recovery Plan Gravelines 03

Cliquez sur Next.

13 - Create Recovery Plan Gravelines 04

Cliquez sur Stretch networks.

13 - Create Recovery Plan Gravelines 05

Cliquez sur Proceed.

13 - Create Recovery Plan Gravelines 06

Choisissez ces informations :

  • Primary
    • Production : base
    • Test Failback : testbase
  • Recovery
    • Production : base
    • Test Failback : testbase

Cliquez ensuite sur + Add Network Mapping.

13 - Create Recovery Plan Gravelines 07

Choisissez ces informations :

  • Primary
    • Production : infra
    • Test Failback : testinfra
  • Recovery
    • Production : infra
    • Test Failback : testinfra

Cliquez ensuite sur + Add Network Mapping.

13 - Create Recovery Plan Gravelines 08

Choisissez ces informations :

  • Primary
    • Production : production
    • Test Failback : testproduction
  • Recovery
    • Production : production
    • Test Failback : testproduction

Cliquez ensuite sur Done.

13 - Create Recovery Plan Gravelines 09

3 réseaux ont été rajoutés dans ce plan de reprise d'activité car la machine virtuelle Gateway utilise ces trois réseaux.

Les deux plans de reprises d'activités sont en production.

13 - Create Recovery Plan Gravelines 10

Etape 2 - Validation du plan de reprise d'activité

Etape 2.1 - Contrôle du plan de reprise d'activité

Utilisation de l'option validation dans le plan de reprise d'activité

Il est possible de valider le plan de reprise d'activité via Prism Central.

Cliquez sur le Recovery VM from Roubaix à valider et tester.

14 - Validate test recovery plan 01

Cliquez sur Validate

14 - Validate test recovery plan 02

Sélectionnez le cluster de Roubaix pour Entity Failing Over From et le cluster de Gravelines pour Entity Failing Over To. Cliquez ensuite sur Proceed

14 - Validate test recovery plan 03

Le plan de reprise est validé, cliquez sur Close

14 - Validate test recovery plan 04

Test du plan de reprise d'activité

Nous avons la possibilité de tester le plan de reprise d'activité sans impacter la production. Le test crée des machines virtuelles avec des noms différents sur le cluster de destination dans les VLAN créés précédemment.

Cliquez sur Test.

14 - Validate test recovery plan 05

Sélectionnez le cluster de Roubaix pour Entity Failing Over From et le cluster de Gravelines pour Entity Failing Over To. Cliquez ensuite sur Test.

14 - Validate test recovery plan 06

Assurez-vous d'avoir les bonnes licences, Si vous avez choisi un cluster avec des licences chez OVHcloud, il est nécessaire d'avoir souscrit le pack Nutanix Advanced sur les clusters de Roubaix et Gravelines.

Cliquez sur Execute Anyway.

14 - Validate test recovery plan 07

Allez dans le tableau de bord des VM dans Prism Central et vous verrez les machines virtuelles de tests qui sont créées avec les données répliquées.

14 - Validate test recovery plan 08

Revenez sur votre plan de reprise et cliquez sur Clean-up test Entities pour supprimer les machines virtuelles de test.

14 - Validate test recovery plan 09

Cliquez sur Clean Up

14 - Validate test recovery plan 10

Etape 2.2 - Live migration des machines virtuelles de Roubaix sur Gravelines

Sur une infrastructure entièrement opérationnelle, il est possible de déplacer des machines virtuelles d'un cluster à l'autre sans coupure de service.

Allez sur une machine virtuelle qui se trouve à Roubaix et qui fait partie du plan de reprise. Nous allons lancer un ping vers le serveur DNS OVHcloud 213.186.33.99.

15 - livemigration Roubaix to Gravelines 00

Revenez sur votre plan de reprise et cliquez sur Failover dans le menu More.

15 - livemigration Roubaix to Gravelines 01

Choisissez Planned Failover, cochez Live Migrate Entities.

Prenez le cluster de Roubaix pour Entity Failing Over From et le cluster de Gravelines pour Entity Failing Over To.

Cliquez ensuite sur Failover.

15 - livemigration Roubaix to Gravelines 02

Saisissez Failover et cliquez sur Failover.

15 - livemigration Roubaix to Gravelines 03

La migration à chaud est en cours.

15 - livemigration Roubaix to Gravelines 04

La migration s'est terminée avec succès sans coupure de service.

15 - livemigration Roubaix to Gravelines 05

Vous pouvez revenir sur la machine virtuelle et constater que le ping continue à fonctionner même si la machine virtuelle a été déplacée d'un cluster à l'autre.

15 - livemigration Roubaix to Gravelines 06

Etape 2.3 - Opérations à effectuer après une migration à chaud

Après une migration, il est nécessaire d'inverser la réplication et le fonctionnement du plan de reprise d'activité.

Inversion de la réplication

Dans le menu principal de Prism Central, cliquez sur Protections Policies dans le sous-menu Data Protection.

16 - invert replication after failover 01

Cliquez sur le plan de protection nommé ROUBAIX TO GRAVELINES.

16 - invert replication aftr failover 02

Cliquez sur Update.

16 - invert replication after failover 03

Positionnez la souris en dessous du nom du cluster de Roubaix dans Primary Location et cliquez sur Edit.

16 - invert replication after failover 04

Cochez le cluster de Gravelines à la place de celui de Roubaix.

16 - invert replication after failover 05

Cliquez sur Save.

16 - invert replication after failover 06

Cliquez sur Update Location.

16 - invert replication after failover 07

Positionnez la souris en dessous du nom du cluster de Gravelines dans Recovery Location et cliquez sur Edit.

16 - invert replication after failover 08

Sélectionnez le cluster de Roubaix à la place de celui de Gravelines.

16 - invert replication after failover 09

Cliquez sur Save.

16 - invert replication after failover 10

Cliquez sur Update Location.

16 - invert replication after failover 11

Cliquez sur Next.

16 - invert replication after failover 12

Cliquez sur Update.

16 - invert replication after failover 12

La réplication est inversée, cliquez sur le bouton pour fermer le plan de protection.

Inversion du plan de reprise d'activité

Dans le menu principal de Prism Central, cliquez sur Recovery Plans dans le sous menu Data Protection.

17 - invert recovery plan after failover 01

Cliquez sur Recovery VM from Roubaix to Gravelines.

17 - invert recovery plan after failover 02

Dans le menu More, cliquez sur Update.

17 - invert recovery plan after failover 03

Dans locations, mettez le cluster de Gravelines dans Primary CLusters et le cluster de Roubaix dans Recovery Clusters puis cliquez sur Next.

17 - invert recovery plan after failover 04

Cliquez sur Proceed.

17 - invert recovery plan after failover 05

Cliquez sur Next.

17 - invert recovery plan after failover 06

Choisissez ces informations :

  • Primary
    • Production : production
    • Test Failback : testproduction
  • Recovery
    • Production : production
    • Test Failback : testproduction

Cliquez sur Done.

17 - invert recovery plan after failover 07

La réplication et le plan de reprise ont été inversés à la suite d'une migration des machines virtuelles de Roubaix vers Gravelines.

Pour revenir à la situation d'origine, il faut effectuer à nouveau une migration à chaud et inverser la réplication et le plan de reprise d'activité. Il est possible d'utiliser cette partie du guide en cas de déclenchement du plan de reprise d'activité en raison de l'indisponibilité d'un cluster.

Etape 2.4 - Exécution du plan de reprise d'activité en condition réelle

Nous allons simuler une perte totale de connexion à Gravelines où se trouvent trois machines virtuelles dans le plan de reprise d'activité (la passerelle Internet et deux autres machines virtuelles).

Connectez-vous en ligne de commande et exécutez un ping permanent vers l'adresse publique de la passerelle.

## Ping à partir d'une console linux distante
ping xx.xx.xx.xx
Reply from xx.xx.xx.xx: bytes=32 time=21ms TTL=58
Reply from xx.xx.xx.xx: bytes=32 time=21ms TTL=58
Reply from xx.xx.xx.xx: bytes=32 time=23ms TTL=58
Reply from xx.xx.xx.xx: bytes=32 time=20ms TTL=58

Laissez la commande ping tourner en permanence et retournez dans Prism Central.

Dans le menu principal, cliquez sur VMs dans le sous-menu Compute & Storage.

18 - fail on Gravelines 01

Les trois machines virtuelles du plan de reprise d'activité sont fonctionnelles.

18 - fail on Gravelines 02

Une déconnexion des trois noeuds du cluster de Gravelines va être faite.

La déconnexion est effectuée en supprimant du vRack les 3 nœuds du cluster de Gravelines.

Revenez sur la console qui exécute le ping vers la passerelle, vous allez constater une perte de connexion.

Reply from xx.xx.xx.xx: bytes=32 time=20ms TTL=58
Reply from xx.xx.xx.xx: bytes=32 time=21ms TTL=58
Reply from xx.xx.xx.xx: bytes=32 time=20ms TTL=58
Reply from xx.xx.xx.xx: bytes=32 time=20ms TTL=58
Reply from xx.xx.xx.xx: bytes=32 time=20ms TTL=58
Request timed out.
Request timed out.
Request timed out.
Request timed out.

Dans Prism Central, cliquez en haut à droite sur les tâches pour afficher le lancement des tâches et notamment Recovery plan execute.

18 - fail on Gravelines 03

Lors d'un incident sur la totalité d'un cluster (nombre de nœuds insuffisant pour fonctionner, ou une coupure réseau), les machines virtuelles qui font partie du P.R.A. et qui se trouvent sur ce cluster vont être démarrées sur l'autre cluster. Le RPO (Recovery Point Objective) est de 0 secondes, ce qui signifie qu'aucune perte de données ne sera à déplorer.

En revanche, le redémarrage des machines virtuelles sur l'autre cluster va prendre un certain temps. Dans ce guide, 3 machines virtuelles sont redémarrées sur le cluster distant, 4 minutes sont nécessaires pour le démarrage des machines virtuelles. Ce temps est mesurable en effectuant régulièrerment des tests sur les plans de reprise d'activité.

Revenez sur la console texte et vous allez voir que le ping fonctionne à nouveau.

Request timed out.
Reply from xx.xx.xx.xx: bytes=32 time=20ms TTL=58
Reply from xx.xx.xx.xx: bytes=32 time=19ms TTL=58
Reply from xx.xx.xx.xx: bytes=32 time=18ms TTL=58
Reply from xx.xx.xx.xx: bytes=32 time=18ms TTL=58
Reply from xx.xx.xx.xx: bytes=32 time=19ms TTL=58
Reply from xx.xx.xx.xx: bytes=32 time=19ms TTL=58

Rendez-vous dans Prism Central dans la gestion des machines virtuelles, vous verrez les trois machines virtuelles du plan de reprise en double. Elles sont notées comme démarrées mais, en réalité, seules celles redémarrés sur Roubaix fonctionnent.

18 - fail on Gravelines 04

Nous allons reconnecter les trois nœuds dans le vRack pour revenir en mode normal.

Après le retour à la normale, les machines virtuelles qui se trouvent sur le cluster d'origine sont toujours visibles mais éteintes. Vous pouvez les supprimer ou les conserver en cas de problèmes sur les machines virtuelles qui sont redémarrées.

18 - fail on Gravelines 05

Il est possible de voir l'historique de actions de Disaster Recovery dans Prism Central.

Cliquez sur le bouton en haut à droite pour aller dans la configuration de Prism Central.

19 - show Witness information 01

Cliquez à gauche sur Witness et cliquez sur View Usage History.

19 - show Witness information 02

La liste des événements survenus apparaît, cliquez sur Close pour fermer.

19 - show Witness information 03

Aller plus loin

Interconnexion de clusters au travers du vRack

Plan de reprise d'activité sous Nutanix

Réplication asynchrone ou NearSync au travers de Prism Element

Réplication avancée avec Leap

Présentation des vRack

Documentation Nutanix AHV Metro - Witness Option

Échangez avec notre communauté d'utilisateurs sur https://community.ovh.com/.


Cette documentation vous a-t-elle été utile ?

N’hésitez pas à nous proposer des suggestions d’amélioration afin de faire évoluer cette documentation.

Images, contenu, structure… N’hésitez pas à nous dire pourquoi afin de la faire évoluer ensemble !

Vos demandes d’assistance ne seront pas traitées par ce formulaire. Pour cela, utilisez le formulaire "Créer un ticket" .

Merci beaucoup pour votre aide ! Vos retours seront étudiés au plus vite par nos équipes..


Ces guides pourraient également vous intéresser...

OVHcloud Community

Accedez à votre espace communautaire. Posez des questions, recherchez des informations, publiez du contenu et interagissez avec d’autres membres d'OVHcloud Community.

Echanger sur OVHcloud Community

Conformément à la Directive 2006/112/CE modifiée, à partir du 01/01/2015, les prix TTC sont susceptibles de varier selon le pays de résidence du client
(par défaut les prix TTC affichés incluent la TVA française en vigueur).