21 votos

Encontrar la causa de retransmisión TCP dentro de una LAN

Hola habitantes de los Fallos del Servidor

Tengo un irritante problema con una red local de unos 100 equipos, 2 servidores de dominio de Windows, y 12 teléfonos VoIP. Desde su instalación hace alrededor de un año, cada semana o así, nos damos cuenta de un teléfono VoIP restablecimiento de sí mismo - de vez en cuando en el medio de una llamada. Simultáneamente a menudo hay signos de pérdida temporal de la conexión en los equipos: se congela en el explorador, mientras que el acceso a los recursos compartidos de red, los errores en nuestro software de administración debido a la pérdida de la conexión a la base de datos del servidor.

He estado haciendo algunas Wireshark monitoreo sobre la conexión entre la PBX VoIP y el resto de la red. Wireshark recoge un grupo de retransmitir los paquetes TCP en el momento en el que registramos el teléfono se reinicia. El Wireshark muestra el registro de alrededor de 2 grupos de retransmisiones que un día van de los 5 paquetes de a cientos. Aquellos que en cada grupo son principalmente entre la PBX y algunos de los teléfonos VoIP, pero no siempre en el mismo conjunto. A menudo las retransmisiones, al mismo tiempo, son a los teléfonos conectados al mismo conmutador, pero a veces las retransmisiones se presentan junto a los teléfonos en los extremos opuestos de la red. En general, hay coincidencia de las retransmisiones en el paso de tráfico TCP, por ejemplo, entre los equipos cliente y los servidores de archivos.

Los picos en las retransmisiones y el teléfono se restablece no se correlacionan bien con cuando la red está muy cargado. Ellos parecen ocurrir un poco más durante el día, pero la mayoría de en la noche, cuando el tráfico debe ser decreciente. Se producen razonablemente a menudo tarde en la noche cuando la mayoría de los equipos están apagados y el tráfico debe ser más baja.

¿Tienes algunas ideas que pueden ayudar a diagnosticar la causa de problemas como este? Una cosa que todavía no he probado, pero debería tener, es actualizar el firmware de todos los interruptores.

8voto

Russ Wheeler Puntos 173

Las retransmisiones de TCP son generalmente debido a la congestión en la red. Mira para un gran número de paquetes de difusión de la hora que el problema ocurre. Si el porcentaje de tráfico de difusión en su captura está por encima de 3% del tráfico total capturado, entonces usted definitivamente tiene congestión. Busque tanto capa física (ARP) y capa (resolución de nombres) transmisiones en la red. Si encuentras un alto volumen de tráfico de difusión pueden rastrear la fuente de los datos de captura.

7voto

BillThor Puntos 15761

La recopilación de las estadísticas de tráfico para su interruptores puede mostrar que usted tiene períodos donde se están ejecutando en o cerca de la capacidad. Esto puede conducir a reintentos cuando las respuestas no vienen dentro del plazo inicial de tiempo de espera (a menudo de 3 segundos). Esto aumenta la congestión momentáneamente hasta que la congestión de los mecanismos de mitigación de patada en los.

Buscar personas a través de streaming de medios de comunicación como la que se puede disfrutar de ancho de banda rápidamente.

Usted puede ser capaz de mitigar el problema de los teléfonos por traffic shaping. Esto sólo cambiará el problema a otros usuarios.

1voto

McJeff Puntos 1651

Suena como un lazo que abarca de árbol o una tormenta de difusión, especialmente si las retransmisiones y los temas se localizan al mismo interruptor (que diferencia). Cuando ocurre, ¿cuáles son el puerto declara en su dispositivo de L2? ¿Probablemente un interruptor mal o prioridades de puente root mala? Problema interesante.

1voto

barak s. Puntos 11

Probablemente ha resuelto esto ya ha pasado mucho tiempo pero esencialmente necesitas habilitar "Puerto rápido" en los puertos que tienen extremos (teléfonos voip, estaciones de trabajo y servidores). Un teléfono puede enviar PDUs así que si ese tipo se reinicia causará una convergencia de STP ocurrir causando así el FDB mesa para enjuagarse y todos los dispositivos a atravesar el paso de 4/5 STP divertido. Por poner puertos con punto final en "Puerto rápido" que saltarse la espera e ir directo a modo de reenvío.

0voto

Greg Askew Puntos 17236

¿Esperemos que sus teléfonos están en una subred diferente y VLAN de los otros equipos?

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: