62 votos

Cómo [educadamente?] dígale al proveedor de software que no saben de qué están hablando

No es una cuestión técnica, sino una válida, no obstante. Escenario:

HP ProLiant DL380 Gn 8 con 2 x 8-core Xeon E5-2667 Cpu y 256 GB de RAM corriendo ESXi 5.5. Ocho de las máquinas virtuales para un determinado proveedor del sistema. Cuatro máquinas virtuales para probar, cuatro de máquinas virtuales para la producción. Los cuatro servidores en cada entorno de realizar diferentes funciones, por ejemplo: servidor web principal del servidor de aplicaciones, servidor de DB para OLAP y bd de SQL server.

CPU acciones configurado para detener el entorno de prueba afecten a la producción. Todo el almacenamiento en SAN.

Hemos tenido algunas preguntas relacionadas con el rendimiento, y el vendedor insiste en que tenemos que dar el sistema de producción más memoria y vcpu. Sin embargo, podemos ver claramente desde vCenter que las asignaciones existentes no están siendo tocado, por ejemplo: una visión mensual de utilización de la CPU en el principal servidor de la aplicación se cierne alrededor de 8%, con algún pico de hasta el 30%. Los picos tienden a coincidir con el software de copia de seguridad patadas en.

Historia Similar en RAM - el más alto de la utilización de la figura a través de los servidores es de ~35%.

Así, hemos estado haciendo algo de investigación, el uso de Process Monitor (SysInternals de Microsoft) y Wireshark, y nuestra recomendación para el vendedor es que hagan algo de TNS de optimización en la primera instancia. Sin embargo, este es además el punto.

Mi pregunta es: ¿cómo podemos llegar a reconocer que el VMware estadísticas que hemos mandado son evidencia suficiente de que más de RAM/vCPU no?

--- ACTUALIZACIÓN 12/07/2014 ---

Semana interesante. Nuestra gestión de TI han dicho que debemos realizar el cambio a la VM asignaciones, y ahora estamos a la espera de algún tiempo de inactividad de los usuarios de negocios. Extrañamente, los usuarios de negocios son los que diciendo que ciertos aspectos de la aplicación se ejecutan lentamente (en comparación con lo que, no sé), pero que van a "háganoslo saber" cuando se puede tomar el sistema (se quejan, se quejan!).

Como un aparte, el "lento" de aspecto del sistema es que al parecer no es el HTTP(S), elemento, es decir: la "delgada app" utilizado por la mayoría de los usuarios. Suena a que el "cliente pesado" instala, utilizada por el principal de finanzas de la bod, que al parecer es "lento". Esto significa que ahora estamos considerando el cliente y la interacción cliente-servidor en nuestras investigaciones.

Como el propósito inicial de la pregunta fue a buscar ayuda ya sea para ir por el "empuje" de la ruta, o simplemente hacer el cambio, y ahora estamos haciendo el cambio, voy a cerrarlo con longneck's respuesta.

Gracias a todos por sus aportaciones, como de costumbre, serverfault ha sido más que un foro es como un psicólogo del sofá :-)

94voto

webyz Puntos 11

Sugiero que para realizar los ajustes que han solicitado. A continuación, comparar el rendimiento de mostrar que es que no hizo ninguna diferencia. Usted podría incluso ir tan lejos para comparar con MENOS memoria y vCPU para hacer su punto.

También, "Le estamos pagando para apoyar el software con soluciones reales, no conjeturas."

81voto

bigmattyh Puntos 9167

Yo solía trabajar en el apoyo - y parte de lo que le estás pidiendo suena muy racional (y probablemente es): pero hay algunas preguntas que debe hacerse antes de que haga la "mejora del rendimiento" están solicitando

  • se ejecuta al menos en el vendedor declaró requisitos mínimos del sistema ya?
  • si usted está por lo menos al mínimo sysreqs, están ya en sus "recomendados" configuración del sistema?

Vendedores 99 veces de cada 100 (en mi experiencia - tanto en el lado de soporte y el cliente/campo de lado) ni siquiera lidiar con problemas relacionados con el rendimiento hasta que/a menos que los sistemas de partido de lo que su documentación. Tal vez es un sistema que funciona bien el 99,5% del tiempo de ingenio 1 CPU y 512 mb de memoria RAM - pero si los requisitos del sistema a decir 4 CPUs y 4G de RAM y sólo tienes 2 CPUs y memoria RAM de 1G, que está dentro de sus derechos a la demanda de más recursos a ser asignados*.

Es probable que preguntar a aumentar los recursos del sistema a causa de algo que se encuentra en el laboratorio de desarrollo en el cual un problema desaparezca por arte de magia si se cruza un umbral específico; si este es el caso, sí, es un ejemplo del potencial de los pobres de depuración en su final, pero tenga en cuenta que no tienen tiempo para eliminar todos los posibles bug/problema que se plantea - algunos sólo necesitan ser trabajadas, y si ese es el caso aquí, sólo tiene que ir con ella.

También hay un no despreciable probabilidad de que los problemas que estamos viendo no son aún parte de "su" software, sino un componente que dependen de algún otro origen (proveedor, SOS biblioteca, etc). Me encontré en esta situación exacta relacionados con el tamaño de swap, BEA WebLogic, y el Sun JRE en un cliente hace un par de años.

tl;dr:

En definitiva, trabajar con su equipo de apoyo, la escalada como sea necesario, hasta encontrar una solución - pero no te sorprendas cuando algunas de las sugerencias / depuración de medidas / arreglos de sonido off-the-wall o sin sentido.


*Si verdaderamente no "necesitan" los recursos adicionales, usted está probablemente en un lugar para ser capaz de presentar un doc bug / RFE para futuras versiones, pero no empujar la ruta hasta que se ha demostrado que no es el tema en cuestión
^un libro electrónico que me escribió usted puede encontrar útil sobre el tema: la Depuración y el Apoyo a los Sistemas de Software

67voto

Matthew Ife Puntos 12680

Siempre y cuando estés seguro de que están dentro de las especificaciones del sistema en el que se documentan.

Entonces cualquier reclamo que están haciendo en cuanto a que requieren más memoria RAM o CPU que debe ser capaz de realizar copias de seguridad. Como los expertos en su sistema que la gente rinda cuentas sobre esto.

Pídales detalles.

  • Lo que la información proporcionada en el sistema indica más RAM se necesita y cómo se interpreta esto?

  • Lo que la información proporcionada en el sistema indica que más de la CPU se necesita y cómo se interpreta esto?

  • Los datos que yo tengo - a primera vista - contradice lo que usted me dice. Puede que me explique por qué se puede interpretar de forma incorrecta?

  • Yo soy la interpretación de este [obvio serie de datos] significa [obvia]. Usted puede confirmar estoy interpretando correctamente con respecto a mi problema?

Después de haber tratado con apoyo en el pasado he hecho las mismas preguntas. A veces yo estaba en lo correcto y que no estaban centrando su atención en mi problema correctamente. Otras veces, sin embargo, yo estaba equivocado y yo era la interpretación de los datos de forma incorrecta, o no incluir otros datos que fue importante en mi análisis.

En cualquier caso, ambas situaciones fueron un beneficio neto para mí, he aprendido algo nuevo que no sabía antes - o tengo sus equipos de apoyo a pensar más acerca de mi problema para obtener una decente de la causa root.

Si el equipo de apoyo no son capaces de dar con una lógica de expansión de su argumento a una base que puede ser satisfecho con (usted necesita tener una mente abierta para comprometer a sí mismo, ser razonable aceptar su interpretación de los datos es incorrecto), entonces debe ser muy presente en su respuesta. Incluso, en el peor de los casos, usted puede utilizar esto como una base para la escalada del problema.

17voto

Tim Brigham Puntos 8727

La gran cosa es ser capaz de demostrar que usted está utilizando las mejores prácticas para su sistema de asignación, en particular, la RAM y la CPU reservas para SQL server.

Todo esto se dice la cosa más fácil es hacer los ajustes solicitados, al menos temporalmente. Si nada más se tiende a conseguir los vendedores sobre los pies arrastrando. No puedo contar el número de veces que he necesitado para hacer algo loco como para satisfacer la tecnología en el otro extremo de la línea de lo que realmente es el software el que no se comporta.

17voto

Tina Puntos 21

Por esta específica situación (en la que han de VMware y los desarrolladores de la aplicación o de un tercero que no comprende la asignación de recursos), yo uso una semana de métricas obtenidas de vCenter Operations Manager (vCops - descargar una demo si es necesario) para identificar las limitaciones reales, los cuellos de botella y los requisitos de tamaño de la aplicación de la VM(s).

A veces, he sido capaz de satisfacer el más terco de los consumidores mediante la modificación de VM reservas o cambios de prioridades para manejar la contención de los escenarios; "Si RAM|CPU son ajustados, SU VM tendrá prioridad!". Mala-mala, las cosas han sucedido cuando he permitido a los proveedores de software para dictar sus requisitos en mi vSphere agrupaciones sin un verdadero análisis.

Pero en general, los números y los datos deben ganar.


Un ejemplo de algo que se utiliza para justificar VM dimensionamiento para el desarrollador de aplicaciones Tomcat:

Dev: La VM necesidades MOAR cpu!

Yo: Bien, la memoria es su mayor limitación, y he aquí un mapa de calor de su rendimiento en comparación con el tiempo... los miércoles a las 6pm son la mayoría de los períodos de estrés, por lo que podemos especificaciones en torno a que el período de máximo esplendor. Ah, y he aquí un tamaño de recomendación basado en las últimas 6 semanas de métrica de la producción...

enter image description here

enter image description here

enter image description here

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: