7 votos

Latencia alta/baja entre los switches Cisco en dos ubicaciones. Cómo solucionar?

Estoy recibiendo las quejas de los usuarios acerca de la red baja el rendimiento de la aplicación entre dos partes de un gran almacén. El software es una de las maldiciones de terminal server basado en la aplicación que se ejecuta en un servidor Linux. Los clientes son PCs que ejecutan un telnet o SSH cliente. El problema comenzó un día, hace no reciente (conocida) cambios en el medio ambiente.

El core switch Cisco Catalyst 4507R-E en el MDF, vinculado a un 4-miembro de la pila de Cisco Catalyst 2960 interruptores en el IDF... están conectados a través de fibra multimodo. Los servidores están en el MDF. Los clientes afectados se encuentran en las FDI.

Haciendo ping desde el Linux servidor de aplicaciones a la 2960 de la pila la dirección de administración a través de la construcción muestra una alta varianza y un montón de latencia:

--- shipping-2960.mdmarra.local ping statistics ---
864 packets transmitted, 864 received, 0% packet loss, time 863312ms
rtt min/avg/max/mdev = 0.521/5.317/127.037/8.698 ms

Sin embargo, los pings a los equipos cliente desde el servidor de aplicaciones son un poco más coherente:

--- charles-pc.mdmarra.local ping statistics ---
76 packets transmitted, 76 received, 0% packet loss, time 75001ms
rtt min/avg/max/mdev = 0.328/0.481/1.355/0.210 ms

Ninguno de los pertinentes Linux o de las interfaces de switchports mostrar errores (vea el fondo de la cuestión).

¿Cómo puedo solucionar esto?

  • Hay un método sencillo para determinar la actividad de los puertos?
  • Es el ping de la varianza en la gestión de la IP del interruptor de la cosa incorrecta a medida?
  • Esto puede ser el resultado de un pícaro PC?
  • Ya que el problema es aislado a una parte del edificio, hay algo más que debe comprobar? Otros usuarios en el almacén están muy bien y no he tenido ningún problema.

Editar:

Más tarde descubrí que el Cisco 2960 utilización de la CPU es muy alto debido a que el error que aquí se detallan.


A partir de la 2960 pila...

shipping-2960#sh int GigabitEthernet1/0/52
GigabitEthernet1/0/52 is up, line protocol is up (connected) 
  Hardware is Gigabit Ethernet, address is b414.894a.09b4 (bia b414.894a.09b4)
  Description: TO_MDF_4507
  MTU 1500 bytes, BW 1000000 Kbit, DLY 10 usec, 
     reliability 255/255, txload 13/255, rxload 1/255
  Encapsulation ARPA, loopback not set
  Keepalive not set
  Full-duplex, 1000Mb/s, link type is auto, media type is 1000BaseSX SFP
  input flow-control is off, output flow-control is unsupported 
  ARP type: ARPA, ARP Timeout 04:00:00
  Last input 00:00:00, output 00:00:01, output hang never
  Last clearing of "show interface" counters never
  Input queue: 0/75/0/0 (size/max/drops/flushes); Total output drops: 441
  Queueing strategy: fifo
  Output queue: 0/40 (size/max)
  5 minute input rate 3053000 bits/sec, 613 packets/sec
  5 minute output rate 51117000 bits/sec, 4815 packets/sec
     981767797 packets input, 615324451566 bytes, 0 no buffer
     Received 295141786 broadcasts (286005510 multicasts)
     0 runts, 0 giants, 0 throttles
     0 input errors, 0 CRC, 0 frame, 0 overrun, 0 ignored
     0 watchdog, 286005510 multicast, 0 pause input
     0 input packets with dribble condition detected
     6372280523 packets output, 8375642643516 bytes, 0 underruns
     0 output errors, 0 collisions, 0 interface resets
     0 babbles, 0 late collision, 0 deferred
     0 lost carrier, 0 no carrier, 0 PAUSE output
     0 output buffer failures, 0 output buffers swapped out

De salida adicionales:

Cisco 4507R-E de la CPU - ordenados.

Cisco 2960 uso de la CPU - ordenados.

tcam utilización de 2960. No disponible en el 4507.

shipping-2960# show platform tcam utilization

CAM Utilization for ASIC# 0                      Max            Used
                                             Masks/Values    Masks/values

 Unicast mac addresses:                       8412/8412        335/335   
 IPv4 IGMP groups + multicast routes:          384/384           1/1     
 IPv4 unicast directly-connected routes:       320/320          28/28    
 IPv4 unicast indirectly-connected routes:       0/0            28/28    
 IPv6 Multicast groups:                        320/320          11/11    
 IPv6 unicast directly-connected routes:       256/256           1/1     
 IPv6 unicast indirectly-connected routes:       0/0             1/1     
 IPv4 policy based routing aces:                32/32           12/12    
 IPv4 qos aces:                                384/384          42/42    
 IPv4 security aces:                           384/384          33/33    
 IPv6 policy based routing aces:                16/16            8/8     
 IPv6 qos aces:                                 60/60           31/31    
 IPv6 security aces:                           128/128           9/9     

Cisco 2960 uso de la CPU de la historia...

shipping-2960#show processes cpu history

    3333333444443333344444444443333333333444443333344444444443
    9977777111119999966666222229999977777555559999911111000008
100                                                           
 90                                                           
 80                                                           
 70                                                           
 60                                                           
 50                  *****               *****                
 40 **********************************************************
 30 **********************************************************
 20 **********************************************************
 10 **********************************************************
   0....5....1....1....2....2....3....3....4....4....5....5....
             0    5    0    5    0    5    0    5    0    5    
               CPU% per second (last 60 seconds)

    4488887787444454444787888444444454677774444444447888544444
    6401207808656506776708000447546664789977697589953201636647
100                                                           
 90                                                           
 80   *###*##*         *#*##*          *#**          ###      
 70   #######*         *#####         *###*         *###      
 60   #######*         *#####       * *####         *###*     
 50 * ########*********######  ** *** *####*********####* ** *
 40 ##########################################################
 30 ##########################################################
 20 ##########################################################
 10 ##########################################################
   0....5....1....1....2....2....3....3....4....4....5....5....
             0    5    0    5    0    5    0    5    0    5    
               CPU% per minute (last 60 minutes)
              * = maximum CPU%   # = average CPU%

    8889888888888888988888889888888888888888888888888888888888888888898889
    2322334378633453364454472653323431254225563228261399243233354222402310
100                                                                       
 90    *    ***   * **  *  ****        *   ***   * *  **       *     *   *
 80 *#############################*********************************#******
 70 *#####################################################################
 60 *#####################################################################
 50 ######################################################################
 40 ######################################################################
 30 ######################################################################
 20 ######################################################################
 10 ######################################################################
   0....5....1....1....2....2....3....3....4....4....5....5....6....6....7.
             0    5    0    5    0    5    0    5    0    5    0    5    0 
                   CPU% per hour (last 72 hours)
                  * = maximum CPU%   # = average CPU%

5voto

EtienneT Puntos 1552

Los switches Cisco pone ICMP en la parte inferior de la lista de prioridades. Conseguimos los mismos resultados si podemos hacer ping a un ocupado 3750-X.

Usted tiene que mirar en la utilización del sistema en los interruptores, como sospecho que están tan ocupados que están haciendo de software de procesamiento de paquetes. Se que la ejecución de cualquier tipo de capa 3 servicios de estos?

Hay un muy grave error en IOS 12.2.53:

CSCth24278 (switches Catalyst 2960-S)

La utilización de la CPU en el interruptor permanece alta (50 a 60 por ciento) cuando el interruptor no es la que se accede por telnet o una sesión de consola. Cuando telnet en la consola o en el interruptor, la CPU va abajo.

No hay ninguna solución.

Actualizar a 12.2.58-SE1 o posterior para corregir esta situación.

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: