14 votos

¿Cómo se puede controlar un servidor de supervisión?

Así que nos ejecutar Groundworks (Nagios) en CentOS para controlar nuestra distintos servidores y procesos. Tengo el programa de instalación para enviar automáticamente correos electrónicos y mensajes de texto SMS cuando las cosas alcanzan un estado de ADVERTENCIA o CRÍTICO. Normalmente, esto funciona a la perfección. Sin embargo, dos veces hemos tenido problemas con Postfix en el que el servidor donde Postfix decide detener el envío de correo electrónico. El más reciente tiempo duró 4 días, porque ninguno de nosotros notado.

Eso me lleva a una pregunta importante: ¿cómo se supone que voy a controlar mi servidor de supervisión?

14voto

Sean Reifschneider Puntos 4951

Otras personas sugieren que el envío de mensajes regulares diciendo que las cosas están bien, pero personalmente no estoy de acuerdo con eso. El monitoreo debe estar en silencio, a menos que exista un problema, y nunca debe depender de un usuario se percate de que algo está mal, como "Oh, no he conseguido que a diario e-mail en un par de días." Especialmente si usted tiene más de una persona de responder a las alertas, cada uno puede pensar que el otro ya ha eliminado el diario "estoy bien" mensaje.

Disponemos de un servicio externo (de los que hay cientos, pero usamos wormly) para hacer HTTP cheques de nuestro servidor de supervisión para asegurarse de que es y puede llegar a Internet. Esa es nuestra principal preocupación para la vigilancia. A continuación, nuestro servidor Nagios monitores de todos nuestros clientes Nagios servidores.

Pero, un buen punto. Probablemente deberíamos agregar una dirección URL HTTP que comprueba el postfix cola y si se muestra el número inusual de los mensajes, lo que probablemente significa que tiene cualquiera en la cola, a continuación, generar una alerta. Otra opción sería el uso de diferentes métodos para alertas, decir un no-SMTP de entrega de SMS agente así como SMTP que utilizamos actualmente.

En nuestro caso, sin embargo, yo no recuerdo que alguna vez hemos tenido el servidor de correo de morir. Por supuesto, todo lo que el servidor de correo se utiliza para el envío de alertas de Nagios, por lo que la configuración es muy simple y casi nunca cambia.

12voto

mattdm Puntos 4959

Con un segundo servidor de supervisión, por supuesto. La segunda puede ser mucho más simple, ya que todo lo que necesita hacer es monitorear la primera. Y debe ser supervisado por el principal sistema de vigilancia en turno, por supuesto.

Si su grupo es parte de una organización mayor que la separan de las infraestructuras, usted puede ser capaz de hacer los arreglos para que otro grupo del servicio de supervisión de ver el tuyo.

También puede asegurarse de que el servidor envía un "está bien" mensaje cada día, y conseguir en el hábito de mirar por ella. (Que sólo es eficaz si no estás abrumado con mensajes de rutina, por supuesto).

5voto

TonyB Puntos 2482

Obviamente tu postfix debe ser monitoreado demasiado, pero eso es otro tema ;)

Puedo usar Nagios comprobador de plug-in para Firefox, siempre se está ejecutando en una barra de estado en cualquier ordenador que uso habitualmente.

Además tengo un script personalizado en el exterior de acogida que los pings en el nagios host y envía SMS si no responde a los pings.

Hasta el momento (5+ años) anduvo bien (toco madera).

2voto

BXAtWork Puntos 21

Para el monitoreo de servidor de monitorización (nagios en nuestro caso), la libre o plan básico de Pingdom o alertfox de las grandes obras.

1voto

Sven Puntos 51980

Primero: Vamos a enviar "I am alive" de los mensajes de una vez o dos veces al día. Segundo, me encuentro con una vieja máquina sólo para este propósito, el cual tiene otro módem GSM, una pequeña UPS etc. y un dedicado (directo) conexión con el principal servidor de supervisión. Esto ayuda con el punto tres: así que asegúrese de comprobar el estado de sus sistemas de monitoreo con regularidad. El pequeño auxiliar de supervisión del sistema muestra la página de estado del sistema primario en mi oficina todo el tiempo.

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: