18 votos

Una herramienta desconocida está destruyendo nuestras Máquinas Virtuales y no podemos ID

Una vista de la consola de Windows 2008 R2 VM, en vSphere es la que muestra la siguiente pantalla:

Screengrab of program

La operación "2 de 2" "Limpieza de disco"

Alguien puede asesorar sobre lo que este programa es?

Algo de información sobre este misterio:

Un número de máquinas virtuales que están ahora afectados. El síntoma es que después de reiniciar "sistema operativo no encontrado" mensaje aparece.

  • VM se ejecutan en ESXi. VM se ejecutan en un determinado almacén de datos
  • Netapp NFS montar el disco en una caja no muestra la tabla de particiones, no han sido capaces de volcado hexadecimal.
  • VM no era hard reset, tendría que ser un sistema operativo inició soft reset
  • NO hay iso montado no era "no invitado" el acceso a la VM, por lo que sería necesario RDP o similar
  • Las copias de seguridad se realizan con netapp software de copia de seguridad durante la noche
  • NFS en cuestión es delgada configurado en el back-end (de la matriz), y de que acabó el espacio, después de que nos vimos estas cuestiones.

10voto

Rqomey Puntos 830

Por desgracia parece que no puede llegar a la parte inferior de lo que la aplicación fue, pero para obtener algo de valor a partir de este incidente, yo quería crear una referencia respuesta. Esto es VMware y virtual de la capa de gestión centrado en el. Muchos administradores están en segregados, y no puede ir de invitado o de almacenamiento de acceso rápido, y esto es para ellos :)

http://support.seagate.com/kbimg/flash/laptop/Laptop.swf parece ser el más parecido al de una aplicación real, que @MosheKatz encontrado.

Si esto sucediera en el futuro, la investigación debe ser la siguiente manera:

  • Observa algunas pero no todas las máquinas virtuales se han estrellado. Usted cree que esto es debido a un problema de almacenamiento (ya que generalmente la causa más probable)
  • Primer intento de aislar un factor común. Son todos estrelló máquinas virtuales que comparten el mismo almacén de datos? En este caso eran, pero algunas Máquinas estaban bien, por lo que descartamos que obvia los problemas de hardware.
  • Compruebe todas las roturas de VMs a ver si había un factor común (el tiempo, función, etc). En este caso no la hubo.
  • Verificación de otros eventos inusuales. Algo que levantaron la bandera aquí:

    • El almacenamiento NFS era delgado-copia (en el nivel de matriz). Esto significa que aunque por ejemplo. 200GB se presenta a los hosts ESXi, de hecho sólo 100 gb está disponible. Sólo la matriz tiene este conocimiento, sin embargo. Lo que encontramos fue un número de máquinas virtuales que estaban en pausa ya que se había quedado sin espacio en disco. Nosotros a pesar de que esto puede haber sido la causa root, así que nuestra primera acción fue para asignar más espacio de almacenamiento en la parte final, para quitar esto como un problema.
  • Una vez que esto se ha resuelto (un simple cambio de interfaz de usuario), y la pausa máquinas fueron reiniciar con éxito, nos devuelve al problema original. Hemos montado los discos virtuales de la quebrada de las máquinas virtuales de un trabajo de VM, y vio que no había tabla de particiones en los discos. No teníamos un hex viewer disponibles, por lo que tuvieron que asumir los discos ahora estaban vacíos.

  • El sistema de monitoreo alertado sobre una nueva máquina virtual que acaba de responder. Esta era grande, como una carga de VM tenido minutos antes de que acaba de cumplir onu-sensible debido a que el espacio en disco en cuestión, por lo que el hecho de que esta nueva VM fue encontrado rápidamente era un signo de buena supervisión de la administración.

  • Abrimos una consola y comprueba el huésped, y vio la pantalla de arriba-agarrar.

    • En esta etapa me fui para el servidor de fallo de la sala de chat para ver si el programa podría ser identificados, mientras que mi almacenamiento colega revisado todas virtual de la capa de registros y eventos, para asegurarse de que no había operación de almacenamiento que va desde nuestro área.
  • Lo que debería haber hecho era suspender la VM, permitir la suspensión del archivo a obtener por escrito, y analizar el dump para ver si el programa que se ejecuta pudieron ser identificados. Suspender VM núcleo PDF KB de VMware

Al final del día, que sabía y de la infraestructura Virtual herramientas no se han reportado dentro de un huésped como el de arriba estaba haciendo. Podemos ver que no había ISO montada, y no hay eventos registrados en contra de la VM. Pudimos ver la VM no era "poder duro cíclica", sólo un suave reiniciar (esto es invisible para la infraestructura subyacente). Sabíamos que no sería de almacenamiento a medida que nos había dictaminado que fuera ya. Tenemos la sospecha de que no estaba automatizado, al igual que estaba sucediendo en el transcurso de un par de horas en mv específicas. Nos imaginamos que no era malicioso como ¿por qué la consola informe de borrado de Disco si lo fue :)

Así, la conclusión fue iniciada por el usuario de borrado de disco. Que tan lejos como mi investigación fue, pero espero que hayas encontrado útil.

Lecciones Aprendidas:

  • Copia de seguridad y prueba de su restaura
  • Asegúrese de que todos los usuarios, la particularidad de administración de usuarios, saben que están trabajando en un aprovisionamiento ligero medio ambiente, y debe evitar cualquier cosa como de escritura de disco de formato (es decir. escribir cargas de 1
  • Tener un buen sistema de monitoreo en el lugar.
  • Y una nueva para mí: En cualquier entorno virtual, tiene una de las herramientas de VM listo, incluso apagado, con las herramientas de diagnóstico instalado; rendimiento de la red, de almacenamiento. Si esto estaba disponible podríamos haber montado y se realiza un volcado hexadecimal en el disco dañado para ver si estaba realmente vacío, o simplemente falta de un mbr. Podríamos también han visto si estaba escrito con 1.

-1voto

doc Puntos 1

Yo creo que tu problema es un estándar de VMware espacio de recuperación de la característica.

Este artículo puede ayudarle a: limpieza de uso Eficiente del Espacio de Disco Virtual de preguntas

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: