Solución de problemas de VMware: problema de caída de red

Hola internatura ! Aquí Federico en un nuevo post para ustedes !
Espero que les sirva y nos vemos en el próximo tutorial

Hola compañeros administradores de VMware. Una y otra vez hemos tratado cuestiones extrañas que son difíciles de precisar.

Un tema que he tratado recientemente fue muy frustrante y me hizo profundizar en la resolución de problemas, en el núcleo y lo que he encontrado se muestra a continuación.

Sin embargo, antes de ir más allá en el artículo, dejadme que os cuente un poco de historia. Varios días antes del problema, añadimos otros tres anfitriones en nuestro clúster VMware actual. Los anfitriones son servidores Rack con tarjetas de 10 GBE, ya que tenemos un entorno de producción masivo.

Después de instalar físicamente los servidores, instalar ESXi y añadir los hosts al clúster, vimos que la conectividad de red a los hosts iba disminuyendo cada vez que había una operación VMotion de muchas máquinas, ya sea manualmente o mediante DRS .

Después de examinar los registros del núcleo y obtener un poco de ayuda de VMware, concluimos que las tarjetas de 10 GBE que había en el nuevo servidor no estaban certificadas para ESXi y que el controlador que utilizaban no era adecuado.

He aquí un par de capturas de pantalla del vmkernel mientras ejecutaba VMotion:

Como podemos ver, de repente el zócalo se cierra y el controlador falla, lo que hace caer el adaptador de red, lo que también hace caer la red de gestión. Un reinicio rápido de la red de gestión soluciona el problema temporalmente hasta que inicie otro VMotion y volverá a fallar.

Ahora llega la parte divertida! La solución permanente.

Parece que VMware tiene dos conjuntos de controladores para este tipo de tarjetas: una ixgbe y ixgben conductor.

Este problema ocurre cuando el archivo ixgben utiliza el controlador y parece que hay una incompatibilidad entre este controlador y la tarjeta de red. Falla cuando el valor de la memoria intermedia aumenta debido a las elevadas datos de VMotion.

Para solucionar este problema, sólo desactivaremos el archivo ixgben y active el controlador ixgbe

una.

Para ello, ejecutaremos los siguientes comandos desde el intérprete de comandos de gestión:

# esxcli system
module set --enabled=true --module=ixgbe
# esxcli system
module set --enabled=false --module=ixgben

Ahora reinicie el anfitrión ESXi y ya está. Espero que este artículo le ayude y vuelva por mucho más.

Deja un comentario