Icono del sitio porciNews, la revista global del porcino

Media Vs Mediana – ¿Cuál se acerca más a la realidad de tus cerdos?

Escrito por: Laura Pérez Sala - Licenciada en Veterinaria por la UAB y Master en Sanidad y Producción Porcina por la UdL. Trayectoria profesional se desarrolló en el área del marketing de la industria del Petfood En la actualidad ejerce como Veterinaria especialista en producción porcina y Personal Coach

Me imagino que más de uno debe preguntarse que tenia esta mañana mi café…

Bueno, normalmente en los artículos semanales intento transmitir dudas o cuestiones que están en el campo, los trending topics del sector porcino, y está claro que la estadística no es uno de ellos, pero precisamente ayer se dio una situación que me llevó a escribir ésta entrada.

Todos los que trabajamos en el sector porcino estamos acostumbrados a manejar y calcular un montón de datos que nos proporciona el programa de gestión, y en muchas ocasiones realizamos pequeñas (o grandes) pruebas, donde manejamos infinidad de números (pesos, GMD, IC etc…)

Lo que sí es cierto, es que la mayoría de nosotros usamos siempre la media como herramienta fundamental. Media de Nacidos vivos, Media de destetados, Media de peso al nacer, media de peso al destete…..media, media, media…y ¿qué tal si usáramos la Mediana?

Éste fue el debate que tuve ayer con un ingeniero agrónomo (si, si, y yo Veterinaria, diversión asegurada), y el que me ha inspirados para hoy.

Para el que, en estos momentos, esté rebuscando en los archivos de su cerebro, “yo esto lo sabía”, un pequeño recordatorio:

La media o promedio, Se interpreta como “punto de equilibrio” o “centro de masas  del conjunto de datos. Es un cálculo muy sencillo en el que intervienen todos los datos. Consiste en el sumatorio de todos los datos dividido por el número de valores.

 

La mediana, en cambio, es un valor de la variable que deja por debajo de sí a la mitad de los datos, y por encima, la otra mitad.( una vez que estos están ordenados de menor a mayor). Se sitúa, por lo tanto, en la mitad real de los datos.

Es mucho más difícil de calcular:

Con un ejemplo se entiende muchísimo mejor.

Imaginaos una empresa en la que la mayoría de los trabajadores tienen un sueldo de 1000 euros, excepto 2 encargados que cobran 2000 y el jefe que cobra 6000 euros mensuales.

¿Cuál es el salario medio de la empresa?

Si vemos la media sale casi 2000 euros, si miramos la mediana, nos da 1000.

¿Cuál se aproxima más a la realidad?

Cuando los datos son muy homogéneos la media nos da un valor representativo de la realidad, pero cuando los datos son muy heterogéneos no.

Un ejemplo más cercano a nosotros

Queremos saber el peso de los lechones a destete. Imaginemos que la camada A tiene los siguientes pesos:  (4-3-5-4.5-6.1-5-3-5.1-6.4-6-6.5-5.5-4.9)

Media: 5

Mediana: 5

Como la distribución de los valores es normal, la media y la mediana, coinciden

Ahora, en la misma granja, imaginemos una camada B (1.9-2.3-3.9-3.8-2.9-3.8-3.8-3.95-4.1-4-8.75-10.8-11)

Media: 5

Mediana: 3,9

 

En este caso la Media y la Mediana ya no se parecen en nada.

Esto sucede porque hay valores muy extremos, lechones que apenas alcanzan los 2 kg y los tres últimos que superan los 9.

¿Qué se acerca más a la realidad, la media o la mediana?

En la camada B, donde los valores son muy dispares, la mediana se acerca más a la realidad. Tengo una mayoría de lechones pequeños y 3 muy grandes.

¿Con qué camada os quedaríais vosotros?

Si yo os hago elegir tan solo por la media, os quedaríais con cualquiera de las dos, ya que las dos camadas tienen una media de peso a destete exactamente igual. ¿Pero verdad que cambiaríais de opinión si os dijera la mediana?

Situaciones en las que deberíamos escoger la Mediana:

La primera, cuando los datos no se ajustan a una distribución normal es más correcto utilizar la mediana. Esto es así­ porque la mediana es mucho más robusta, lo que quiere decir que se afecta menos por la presencia de sesgos en la distribución o de valores extremos.

La segunda tiene que ver con lo anterior. Cuando haya valores muy extremos la mediana informará mejor del punto central de la distribución que la media, que tiene el defecto de desviarse hacia los valores extremos, tanto más cuanto más extremos son.

Por último, algunos dicen que con algunas variables tiene más sentido utilizar mediana que media. Por ejemplo, si hablamos de supervivencia, la mediana nos informa sobre el tiempo de supervivencia, pero también sobre cuánto sobrevive la mitad de la muestra, por lo que serí­a más informativa que la media aritmética.

Y entonces, ¿ya no usamos nunca más la media?

Si a todos los valores de la variable se le suma una misma cantidad, la media aritmética queda aumentada en dicha cantidad.

Si todos los valores de la variable se multiplican por una misma constante la media aritmética queda multiplicada por dicha constante:

 

En definitiva, ¿media o mediana?

Mi consejo es que ante valores de distribución normal podéis seguir usando la media con tranquilidad, pero si la muestra tiene una distribución heterogénea, no.

¿Y si no sabemos si es homogénea o no?

En este caso es una buena práctica mirar ambas medidas (la mediana la encontraréis en las fórmulas estadísticas de excel), si coinciden quiere decir que la muestra es homogénea, si no coinciden, la Mediana será más representativa de la realidad muestral

Salir de la versión móvil