VMware HA (High Availability)

Gestionar la política de reinicio con la función HA

Última actualización: 21/02/2018

Objetivo

La función principal de VMware HA(Alta disponibilidad) es reiniciar las máquinas virtuales en otro host del cluster en caso de fallo del hardware. Con HAtambién se pueden supervisar las máquinas virtuales y las aplicaciones.

esquema HA

Esta guía explica cómo configurar esta función

Requisitos

Procedimiento

Activación

La funcionalidad HA está activa por defecto en el primer cluster que OVHcloud le proporciona cuando contrata el servicio Hosted Private Cloud.

Si se crea un cluster nuevo, se puede activar la funcionalidad HA en el proceso de creación del cluster o posteriormente.

Si HA no está activo en su cluster, diríjase a la pestaña Configure de su cluster, y a la sección Disponibilidad de vSphere en la parte de Servicios.

Haga clic en Editar y marque la casilla para activar la funcionalidad HA.

Es importante activar también la supervisión del host. Esta configuración permite el envío de latidos entre los host ESXi para detectar una posible avería. Será necesario desactivarla para llevar a cabo ciertas tareas como las actualizaciones con el update manager. En ese caso, el host estará aislado.

activación HA

Configuración

Fallos y respuestas

Esta primera categoría permite definir la política de reinicio de las máquinas virtuales en función de los posibles fallos.

Respuesta en caso de fallo del host

Esta categoría va a definir la política de reinicio de las máquinas virtuales en caso de pérdida de un host.

Es posible definir que se reinicien sus máquinas virtuales de forma automática. También se puede activar el reinicio por defecto en el cluster. Puede afinar esta configuración por máquina virtual en la pestaña Reemplazo de las MV.

También puede definir una condición diferente a la que viene por defecto (Recursos asignados), que vSphere HA comprobará antes de proceder con el reinicio.

Fallo del host

Respuesta al aislamiento del host.

Esta categoría le permite definir las acciones que deben llevarse a cabo en caso de pérdida de conectividad de red en un host.

Puede elegir entre:

  • No hacer nada.
  • Apagar las máquinas virtuales e intentar reiniciarlas en otro host disponible.
  • Apagar el host en cuestión e intentar reiniciar las máquinas virtuales en otro host disponible.

aislamiento del host

Almacén de datos con PDL

En caso de que falle un almacén de datos con estado PDL (pérdida permanente de dispositivo), se pueden definir las acciones que deben llevarse a cabo:

  • No hacer nada.
  • No hacer nada pero generar logs de los eventos.
  • Apagar las máquinas virtuales e intentar reiniciarlas en los host que siguen teniendo conectividad con el almacén de datos.

Almacén de datos con PDL

Almacén de datos con APD

En caso de que falle un almacén de datos con estado APD (all path down), se pueden definir las acciones que deben llevarse a cabo:

  • No hacer nada.
  • No hacer nada pero generar logs de los eventos.
  • Apagar las máquinas virtuales e intentar reiniciarlas.

Almacén de datos con APD

Supervisión de las MV

La supervisión de las máquinas virtuales está disponible después de instalar las VMware tools. En caso de no haber respuesta a través de las tools(latidos), la máquina virtual se reiniciará de forma automática. Se puede realizar una configuración avanzada con respecto a esta funcionalidad (por ejemplo, con intervalos de reinicio).

Supervisión de las MV

Control de admisión

vSphere HA utiliza el control de admisión para garantizar que se reserven recursos suficientes para la recuperación de máquinas virtuales cuando se produce un fallo en el host.

El control de admisión impone restricciones sobre el uso de recursos. No se permite ninguna acción que pueda infringir estas restricciones. Algunos ejemplos de acciones que pueden no estar permitidas son:

  • Encendido de una máquina virtual
  • Migración de una máquina virtual
  • Aumento de la reserva de CPU o de memoria de una máquina virtual

El control de admisión de vSphere HA se basa en la cantidad de errores de host que el clúster puede tolerar sin perder la capacidad de conmutación por error. La capacidad de conmutación por error del host puede definirse de tres formas:

Almacén de datos de latidos

Cuando el host principal de un cluster HA no puede comunicarse con un host subordinado en la red de gestión, el host principal utiliza el latido de almacén de datos para determinar si el host subordinado tiene fallos, si se encuentra en una partición de red o si está aislado de la red.

Opciones avanzadas

Es posible realizar varios ajustes de configuración avanzada en el cluster.

Para ello, debe dirigirse a esta página.

Regla HA

En la sección configuración, en la pestaña Reglas MV/Host, se puede crear una regla del tipo «Máquinas virtuales a máquinas virtuales».

Esta añadirá una condición de reinicio para garantizar que las máquinas virtuales de un primer grupo se enciendan antes de encender las de un segundo grupo.

Esta regla puede añadirse como complemento de las prioridades de reinicio configurables en la pestaña Sustituciones de MV.

Más información

Interactúe con nuestra comunidad de usuarios en https://community.ovh.com/en/.


Did you find this guide useful?

Please feel free to give any suggestions in order to improve this documentation.

Whether your feedback is about images, content, or structure, please share it, so that we can improve it together.

Your support requests will not be processed via this form. To do this, please use the "Create a ticket" .

Thank you. Your feedback has been received.


These guides might also interest you...

OVHcloud Community

¡Acceda al espacio de la OVHcloud Community! Resuelva sus dudas, busque información, publique contenido e interactúe con otros miembros de la comunidad.

Discuss with the OVHcloud community