9 votos

¿Está mal el puerto de mi switch Cisco?

He estado persiguiendo un problema de pérdida de paquetes y estabilidad de la red para un puñado de usuarios finales en una red interna durante los últimos días... Estos problemas salieron a la luz la semana pasada, sin embargo la ubicación era golpeado por un rayo hace seis semanas.

Veía entre un 5 y un 10% de pérdida de paquetes entre una pila de cuatro Cisco 2960 y varios PC y teléfonos al otro lado de un recorrido de 77 metros. Los PC's estaban en línea con los teléfonos sobre un enlace troncalizado ( configuración de switchport pastebin ). Se producían caídas de llamadas e interrupciones en las aplicaciones cliente-servidor y en la conectividad de Microsoft Exchange.

Probé los pasos habituales de resolución de problemas de forma remota, haciendo que un técnico local hiciera lo siguiente durante las pausas en la actividad de los usuarios y de la producción:

  • cambiar los cables entre la toma de pared y el dispositivo.
  • cambiar los cables de interconexión entre el panel de interconexión y los puertos del conmutador.
  • pruebe con diferentes puertos de conmutación dentro de la pila 2960.
  • cambiar los dispositivos de los usuarios finales por equipos de calidad conocida (nuevos teléfonos, diferentes PC).
  • borrar los contadores de la interfaz del puerto del conmutador y supervisar de cerca los errores de incremento. ( Pastebin salida de sh int )
  • Revisé los registros de los dispositivos y Gráficos Observium RRD . No hay problemas de enlace de subida/bajada desde el lado del conmutador.
  • cambiar las regletas en el lado del usuario final.
  • cable de prueba se extiende desde el Cisco 2960 utilizando test cable-diagnostics tdr int Gi4/0/9 (limpio)*
  • compruebe los tramos de cable con un comprobador de cables Tripp-Lite. (limpio)
  • ejecutar diagnósticos en los miembros de la pila de conmutadores. (limpio)

Al final, fueron necesarios tres cambios de puertos de conmutación para encontrar una solución estable. La única conclusión lógica es que algunos puertos de conmutación del Cisco 2960 están mal o fallan... No están muertos, pero tampoco tienen un comportamiento consistente. No estoy acostumbrado a ver puertos individuales morir de esta manera.

¿Qué más puedo probar o comprobar para determinar si estos dispositivos están mal?

¿Cuál es el enfoque de mejores prácticas para verificar esto?

¿Es habitual que haya problemas en un solo puerto y no en un banco contiguo de puertos?


BTW - show cable-diagnostics tdr int Gi4/0/14 es muy chulo...

Interface Speed Local pair Pair length        Remote pair Pair status
--------- ----- ---------- ------------------ ----------- --------------------
Gi4/0/14  1000M Pair A     79   +/- 0  meters Pair B      Normal              
                Pair B     75   +/- 0  meters Pair A      Normal              
                Pair C     77   +/- 0  meters Pair D      Normal              
                Pair D     79   +/- 0  meters Pair C      Normal

0 votos

¿Podría añadir "show interface gi4/0/9"... también su salida tdr es de gi4/0/14... cuántos puertos están teniendo el problema?

0 votos

@MikePennington 4 interfaces de 48 mostraban problemas. Los contadores han sido borrados. Pero el único contador que se incrementaba era: Total output drops: 1461

0 votos

1461 gotas de un total de cuántos paquetes de salida? ¿Están los cuatro puertos problemáticos mostrando caídas de salida?

7voto

rnxrx Puntos 6464

Aunque los bancos de puertos suelen compartir un ASIC, cada uno tiene que tener su propio PHY independiente. Si el PHY se ha dañado, podría tener un problema mientras que sus vecinos no.

Dicho esto, las caídas de salida son un síntoma extraño para un problema físico, no imposible, pero no típico. A pesar de los enlaces semidúplex, las caídas de salida suelen tener más que ver con el agotamiento del búfer que con problemas físicos.

Puedes obtener más información configurando una captura de paquetes en el otro lado del cable. Se espera que un PHY defectuoso se manifieste con algún número de errores de capa física (CRC defectuoso, runt/giant, etc) en uno o ambos lados del enlace.

En definitiva, parece que has eliminado lo suficiente como para que se haya superado el punto de rendimiento decreciente. Yo recomendaría un RMA si usted tiene un contrato.

0 votos

Dado que esto ocurre en varios puertos de varios (2) conmutadores, pero sólo para un pequeño subgrupo de usuarios, ¿es éste un caso en el que tendría que sustituir los cuatro conmutadores? Es que me resulta difícil abogar por la sustitución sin conocer el problema principal, ya que la sustitución requerirá un tiempo de inactividad considerable, recableado, etc.

0 votos

Los rayos son un animal muy extraño y sus daños pueden manifestarse mucho más tarde y de forma imprevisible. El tiempo de inactividad apesta, por supuesto, pero podría mejorarse un poco poniendo en bucle el interruptor de reemplazo, moviendo los parches y luego sacando los viejos. Ojalá hubiera una respuesta más fácil, pero si has aislado el problema a unos pocos puertos, no hay mucho más que hacer.

0 votos

Hoy en día, el PHY está casi siempre integrado en el ASIC. Es sencillamente más barato. La magnetica es la unica parte que realmente no pueden integrar en el ASIC, que podria ser dañada, pero eso no es el PHY. Además, es bastante común el uso de magneticos Quad set, por lo que si el problema está en 4 puertos, se presta a esta teoría.

2voto

gWaldo Puntos 9177

Sí, un solo puerto puede estar mal, pero si no recuerdo mal, hay que cambiar todo el módulo. (Advertencia: hace mucho tiempo que no he hecho un trabajo significativo en Cisco...)

No estoy seguro de que pueda ayudar, pero echa un vistazo a FITB por Laurie Denness, una de las ingenieras de operaciones de Etsy.

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: