En este post vamos a mostrar cómo se configura y como funciona la nueva funcionalidad High Availability de vCenter Server Appliance 6.5.
Esta nueva funcionalidad esta disponible solo en la versión Appliance de vCenter, es la primera vez que VMware dota de más funcionalidades a la versión Appliance que a la versión Windows, de esta manera continua el camino para no depender de ningún Sistema Operativo Windows. Como todos sabéis esta versión ya lleva embebido el servicio de Update Manager, otro Windows menos 🙂
Esta nueva funcionalidad esta compuesta por 3 nodos, vCenter Activo, vCenter Pasivo y un Witness, estos dos últimos se clonan del vCenter existente. El Failover ocurre ante la caída total de un nodo (en nuestro caso lo simularemos matando el proceso de la máquina virtual del vCenter Activo) o cuando algunos servicios clave caen.
En esta primera versión se espera un RTO de unos 5 minutos, pero puede variar un poco dependiendo de la carga, el tamaño y la capacidad del hardware sobre el que se ejecuta la solución.
En el Laboratorio en el que hemos probado esta nueva funcionalidad teníamos unos recursos muy limitados por lo tanto veremos que hemos desplegado todo sobre un mismo cluster y un mismo almacenamiento, lo lógico al utilizar esta funcionalidad seria segmentar los elementos lo máximo posible tanto en almacenamiento como en computo.
Como requisito a nivel de Networking, debemos tener una red de “Producción” y una red “HA” definida. En nuestro Laboratorio la red de “Producción” sera “VM Network” y la “HA” sera “vCenter_HA”. Ante un fallo del vCenter Activo, el vCenter Pasivo levantara la IP de Producción del Activo.
Una vez comentado lo anterior pasemos a ver como configurar esta nueva funcionalidad.
Desde vSphere Web Client seleccionamos nuestro vCenter, vamos a la pestaña “Configuration” y seleccionamos el apartado “vCenter HA”, pinchamos en “Configure” para comenzar el Wizard de configuración:
El primer paso del Wizard nos deja elegir el tipo de configuración diferenciando entre una configuración desde 0 o bien una configuración en la que ya están deployados los elementos que forman la solución, en nuestro caso estamos realizando una configuración desde 0:
En el segundo paso configuramos el networking de la red “HA” para el vCenter Activo, y seleccionaremos el portgroup que teníamos preparado para esto, en nuestro caso “vCenter_HA”:
En el siguiente paso nos solicitara solamente la IP de la red “HA” para el vCenter Pasivo y el Witness, para el resto de datos utilizara lo mismos que hemos configurado en el vCenter Activo, si fuese necesario podríamos cambiarlos pinchando en “Advanced”:
Nos muestra un resumen de como queda el diseño de la solución, como podemos ver en la captura podemos editar varios aspectos de como queda el diseño (recordar que hemos deployado todo sobre el mismo cluster y almacenamiento debido a las restricciones del Laboratorio utilizado):
Como último paso del Wizard muestra la configuración vCenter HA (podríamos cambiar algún dato si fuese necesario), finalizamos el Wizard:
Vemos que se crea una tarea padre “Deploy a vCenter HA Cluster”, esta lanza una subtarea que comienza a clonar el vCenter Activo (VC en nuestro caso) para crear la máquina virtual que sera el vCenter Pasivo, con el nombre que hemos elegido en el Wizard (VC-peer que es el que nos daba por defecto):
Cuando finaliza, arranca la máquina recién creada y realiza otro clon que genera la máquina que actuara como Witness, en nuestro caso VC-witness:
Cuando acaba el deploy del Witness, arranca la máquina, y finaliza la tarea padre.
Ahora podemos volver a la configuración y ya tenemos todos los elementos de la solución con un “Status UP”, como podemos ver hasta que no pasa un rato desde que finaliza el deploy puede dar un mensaje de que aun tiene una replica inicial en marcha, este mensaje desaparece en unos minutos:
Dejamos que la solución acabe la replica inicial.
Ahora llega el momento de probar el funcionamiento, como vemos en la imagen anterior tenemos un boton “Initiate Failover” que nos permite realizar el Failover manualmente, pero como no nos gusta ponérselo fácil, vamos al ESXi que aloja el vCenter Activo, le pegamos un tiro 🙂 y comprobamos que ya no esta en ejecución:
A la vez estábamos haciendo un ping a la IP de “Producción” del vCenter, 6 pings después, volvemos a tener respuesta:
Si accedemos vía vSphere Web Client vemos el siguiente mensaje:
Cuando hemos forzado la parada del vCenter Activo hemos puesto el cronometro en marcha, 4 minutos 32 segundos después hemos recuperado el acceso a vCenter, esto ademas de cumplir con el RTO esperado, nos parece razonable teniendo en cuenta que todas las pruebas se han realizado en un entorno Nested con pocos recursos.
Como podemos ver en la imagen el nodo Activo ahora es el que tiene asignada la IP 10.10.10.2 en la red vCenter HA, la cual corresponde a VC-peer:
Finalmente y para probar la función, hemos ejecutado el Failover manualmente y los resultados han sido buenos también.
Espero que con este post quede un poco más clara la configuración y como funciona esta nueva funcionalidad.
Por último dar las gracias a mi compañero y amigo Leandro Ariel Leonhardt, ya que montamos el entorno juntos y pasamos un día muy entretenido probando nuevas funcionalidades de vSphere 6.5, por supuesto recomendar su blog https://www.blogvmware.com/
Gracias por compartir 🙂