42 votos

Cómo realizar el seguimiento y registro de la memoria/uso de cpu de los procesos a lo largo del tiempo?

Estoy buscando una forma para diagnosticar problemas, como el intercambio de la muerte, donde un balooning proceso de la memoria se llena de intercambio y mata a toda máquina (como apache).

Ya estoy utilizando cactus y puedo configurar nagios (aunque preferiría no) o munin, pero como lo que yo puedo decir que no se puede grabar un programa individual de uso - solo estado general.

Sé que puedo rodar una secuencia de comandos que >> algunos de archivo cada 30 años, pero me gustaría ver si un maduros existentes solución ya existe.

De nuevo, lo ideal sería:

  • registro de los procesos de uso de la memoria de cada N segundos
  • registro de los procesos de uso de CPU de cada N segundos
  • soporte de gráficos y la historia
  • soporte en los promedios - como mysqld ha utilizado el 43% de la CPU en el último día y un promedio de 400 MB de memoria
  • ser libre y de código abierto

Los nombres de procesos que no son y no deben ser conocidos de antemano - la idea es dejarlo monitor y, a continuación, echar un vistazo a la parte superior de los delincuentes.

Mi sistema es Linux (OpenSUSE).

21voto

BillThor Puntos 15761

Se desea sólo la parte superior de los delincuentes, considere la posibilidad de ejecutar top con un relativamente largo intervalo de tiempo (60 segundos) en el modo por lotes. Usted puede necesitar más de una top ejecución para la captura de la parte superior de los delincuentes en varios recursos. He configurado los sistemas de ejecución top para un par de ciclos cuando un recurso está siendo más utilizado.

Considere la posibilidad de ejecutar sar en el modo por lotes para la captura de la utilización de los recursos. Me doy cuenta de que este está basado en el servidor, pero es útil para determinar los tiempos de cuando se producen problemas.

Ejecutar munin y habilitar las notificaciones. Esto puede darle una oportunidad de salir y ver el servidor que se va hacia abajo. Usted puede ser capaz de corregir el problema antes de que vaya hacia abajo.

Para pérdidas de memoria, un aumento constante en el espacio de intercambio de uso indica que hay un problema. Yo una vez vi un servidor de morir lentamente durante un período de días. El problema de servicio fue un programa de monitoreo de otros procesos de pérdidas de memoria. El sistema de administración siguió insistiendo en el aumento de intercambio de uso no era un problema, hasta el servidor ha dejado de responder.

Usted puede encontrar que cfengine's de detección de anomalías puede ser utilizado para activar un script para capturar el estado del sistema cuando las cosas van mal. Es posible que desee una gran cantidad de información además de los procesos utilizando el máximo de recursos. Para una afluencia repentina de uso es posible que desee una lista de conexiones de red (la dirección no se el nombre). El uso de la memoria es también útil.

15voto

hughdbrown Puntos 15770

sysstat se hace casi exactamente para tu tipo de propósito.

9voto

NinjaCat Puntos 324

He utilizado la cima de antes:

http://freshmeat.net/projects/atop/

"En la cima es un ASCII de pantalla completa del monitor de rendimiento que es capaz de informar de la actividad de todos los procesos (incluso si los procesos han finalizado durante el intervalo), diario registro de sistema y proceso de la actividad para el análisis a largo plazo, destacando sobrecarga de los recursos del sistema mediante el uso de colores, etc. A intervalos regulares, se muestra a nivel de sistema relacionadas con la actividad de la CPU, memoria, swap, discos, y las capas de red, y para cada proceso activo muestra el uso de la CPU, la memoria de crecimiento, la prioridad, el nombre de usuario, estado, y código de salida."

7voto

Pier Puntos 1426

¿Has probado collectd?
Es muy potente y personalizable.
Tiene un montón de plugins y puede ser integrado con nagios.

http://collectd.org/features.shtml

2voto

VisBits Puntos 81

Centreon en la parte superior de Nagios Nagios junto con NRPE. A continuación, puede escribir secuencias de comandos personalizadas para informar de los datos en CUALQUIER formato que usted desee NRPE. Nagios, a continuación, las encuestas de los datos desde servidores remotos con NRPE y Centreon hace un bonito gráfico y añade un montón de flexibilidad para el usuario. Utilizamos en http://beyondhosting.net tengo una VZ Contenedor plantilla con centreon+de configuración de nagios ya si quieres.

Los gráficos de centreon construye hostthenpost.org/tyler/2010-07-23_1719.png

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: