20 votos

Mejor sysadmin WTF?

Seguro que visto con sus propios ojos (o) tarde o temprano: que terrible proyecto/sistema/situación en la que algo quedó TAN jodido que simplemente no puedes creer la verdad es que fue como lo hizo.

La mala gestión? Misbudgeting? Un malentendido? Simplemente tonto, simple ignorancia? El nombre de su causa, seguro que pasó (y sigue ocurriendo mucho, lamentablemente; ver aquí).

Describen aquí, para la diversión (aunque algo de el cínico tipo) y de aprendizaje (esperemos).

Algunas reglas:

  • Este es no es el lugar para el azar (incluso si absolutamente devastador) de administración de errores, así que por favor evite "argh he escrito mal que rm-r" o "OMG ACABO de COPIAR LA BASE de datos DAÑADA por ENCIMA de MI ÚLTIMA COPIA de seguridad BUENA" (estado allí, hecho eso); son de esas cosas que mejor aquí. Esto es acerca de "¿qué tipo de drogas era exactamente bajo la influencia de quienes diseñaron/implementado este sistema?".
  • Uno WTF por post, por lo que puede obtener correctamente, comentó.
  • Por favor, publicar algo que usted realmente testigos :-)
  • Si fue usted quien lo hizo, aún califica :-)

Voy a añadir un poco de material pronto, siéntase libre de añadir sus propios; y por favor :-)

24voto

yulia Puntos 16

Me llamaron de una empresa en la que nunca había oído hablar de antes, que había sido encargado de implementar un correo de Exchange 2003 server para un cliente y no tenía ni idea acerca de cómo hacerlo; nada demasiado extraño, ¿verdad? Yo trabajo como consultor freelance, así que estoy perfectamente bien haciendo trabajos que no sé cómo hacer para que usted (y su dinero).

Así que me fui en el sitio del cliente, y descubrió algo muy extraño: cada servidor en la red fue un controlador de dominio; todos los 15 o así de ellos.

Entonces descubrí algo aún más extraño: no hay uno de ellos se replican correctamente con cualquier otro, Active Directory comportamiento general que sólo podría ser descrito como "errático", los usuarios sobre cualquier problema de la red que usted puede imaginar y el Intercambio sólo se negó a instalar con desconocidos para la humanidad errores.

Así que eché un vistazo a la configuración de red en el servidor, y la vi... estaba utilizando los ISP públicos de los servidores DNS. Luego miro a otro servidor... y era la misma. Luego miro a un DC... la misma cosa. Entonces me pregunté... y fue confirmado oficialmente: cada equipo en la red (sobre 1500) fue el uso de los DNS del ISP en lugar de un legítimo controlador de dominio.

Me puse en la explicación de DNS es bastante crítico para la correcta la operación de Directorio Activo, y fue capaz de reconstruir la historia posterior:

  • Alguien originalmente el dominio de AD correctamente, utilizando un DC como el servidor DNS para cada equipo.
  • Él/ella/él no sabía nada acerca de las agencias de transporte y/o configuración del firewall, por lo que los equipos fueron incapaces de resolver la Internet pública los nombres.
  • Así surgió la idea de utilizar los servidores DNS del ISP en los equipos; se configura en cada uno de ellos.
  • Empezaron a tener un montón de "no se puede encontrar un controlador de dominio de error" (¿quién hubiera imaginado?).
  • Ellos pensaban que el problema fue causado por no tener suficiente DCs, por lo que se procedió a promover cada servidor para ese papel.
  • Huelga decir que esto sólo empeoró las cosas, como los nuevos DCs demasiado utilizado el mal DNSs, por lo que también fueron incapaces de replicar.
  • Esto se prolongó durante meses, simplemente "acostumbrado" a la red está totalmente confiable.
  • En la parte superior de esto, se trata de iniciar la instalación de Exchange, que se estrelló estrepitosamente; sólo entonces se decidió a llamar a algunos consultor externo, y hasta que ellos no tenía absolutamente ni idea de algo que estaba totalmente equivocado en su configuración de red.

23voto

SirStan Puntos 2140

Érase una vez tuve un cliente que era una pequeña empresa (10 personas) con un registro de salud electrónico. (No médico). Me observó un día que las copias de seguridad que había estado fallando. Sobre la prueba, la unidad de cinta no estaba funcionando del todo. Mencioné esto al propietario, quien dijo que él era muy consciente de que la unidad era malo, pero era demasiado caro para reemplazar.

Claro, eso no es muy WTF.

El WTF es que tenía a su personal la rotación de la cinta diaria, teniendo a una caja fuerte, y todo ese jazz para los 6-9 meses desde que se murió.

"No se lo digas al personal, es posible que se preocupe de ellos"

17voto

yulia Puntos 16

Yo estaba trabajando como administrador de sistemas para una Gran Agencia del Gobierno (uno de los órganos principales de la Italia del gobierno), y había sido la gestión de su centro de datos para algunos meses. Una noche, suena el teléfono y mi jefe me dice que algo Muy Malo está sucediendo: corte total de electricidad.

Ok, tenemos UPSes, ¿verdad?

Sí, pero no durará mucho, así que mejor ir allí y cerrar todo hasta que vuelva la energía.

Voy allí, hacer mi camino a través de los pasillos oscuros, llegar a la sala de servidores... y me saludó por lo que sólo puede ser descrito como puro infierno. Literalmente. La habitación estaba tan caliente que podría haber pasteles horneados en ella. Alimentación de la UPS estaba bien, pero la mitad de los servidores ya había apague por sobrecalentamiento y los restantes estaban gritando en agonía.

La razón?

Los servidores estaban en la alimentación de la UPS... el aire acondicionado no estaba.

10voto

l0c0b0x Puntos 8729

Respuesta por correo electrónico de Microsoft de un ingeniero de soporte de un problema:

"En cuanto a mi opinión de su problema, yo tener una sola palabra: RARO".

De oro!

9voto

Tina Puntos 21

HP ProLiant ML370 G3 fallo del ventilador... El ventilador de los sensores de la placa base de este modelo tiende a ir mal después de 5 años. El servidor no se puede arrancar cuando una combinación incorrecta de los fans no es detectado. Tuve que caminar al cliente a través de el lanzamiento de la máquina con un shop-vac (para obtener los ventiladores girando en el arranque) y esta es la forma en que mantiene el servidor que ejecuta hasta que me podría llegar con un nuevo sistema.

enter image description hereenter image description here

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: