La media o promedio, Se interpreta como “punto de equilibrio” o “centro de masas del conjunto de datos. Es un cálculo muy sencillo en el que intervienen todos los datos. Consiste en el sumatorio de todos los datos dividido por el número de valores.
La mayoría de nosotros usamos siempre la media como herramienta fundamental. ¿Qué tal si usáramos la Mediana?
Me imagino que más de uno debe preguntarse que tenia esta mañana mi café…
Bueno, normalmente en los artículos semanales intento transmitir dudas o cuestiones que están en el campo, los trending topics del sector porcino, y está claro que la estadística no es uno de ellos, pero precisamente ayer se dio una situación que me llevó a escribir ésta entrada.
Todos los que trabajamos en el sector porcino estamos acostumbrados a manejar y calcular un montón de datos que nos proporciona el programa de gestión, y en muchas ocasiones realizamos pequeñas (o grandes) pruebas, donde manejamos infinidad de números (pesos, GMD, IC etc…)
Lo que sí es cierto, es que la mayoría de nosotros usamos siempre la media como herramienta fundamental. Media de Nacidos vivos, Media de destetados, Media de peso al nacer, media de peso al destete…..media, media, media…y ¿qué tal si usáramos la Mediana?
Éste fue el debate que tuve ayer con un ingeniero agrónomo (si, si, y yo Veterinaria, diversión asegurada), y el que me ha inspirados para hoy.
Para el que, en estos momentos, esté rebuscando en los archivos de su cerebro, “yo esto lo sabía”, un pequeño recordatorio:
La media o promedio, Se interpreta como “punto de equilibrio” o “centro de masas del conjunto de datos. Es un cálculo muy sencillo en el que intervienen todos los datos. Consiste en el sumatorio de todos los datos dividido por el número de valores.
La mediana, en cambio, es un valor de la variable que deja por debajo de sí a la mitad de los datos, y por encima, la otra mitad.( una vez que estos están ordenados de menor a mayor). Se sitúa, por lo tanto, en la mitad real de los datos.
Es mucho más difícil de calcular:
Con un ejemplo se entiende muchísimo mejor.
Imaginaos una empresa en la que la mayoría de los trabajadores tienen un sueldo de 1000 euros, excepto 2 encargados que cobran 2000 y el jefe que cobra 6000 euros mensuales.
¿Cuál es el salario medio de la empresa?
Si vemos la media sale casi 2000 euros, si miramos la mediana, nos da 1000.
¿Cuál se aproxima más a la realidad?
Cuando los datos son muy homogéneos la media nos da un valor representativo de la realidad, pero cuando los datos son muy heterogéneos no.
Un ejemplo más cercano a nosotros
Queremos saber el peso de los lechones a destete. Imaginemos que la camada A tiene los siguientes pesos: (4-3-5-4.5-6.1-5-3-5.1-6.4-6-6.5-5.5-4.9)
Media: 5
Mediana: 5
Como la distribución de los valores es normal, la media y la mediana, coinciden
Ahora, en la misma granja, imaginemos una camada B (1.9-2.3-3.9-3.8-2.9-3.8-3.8-3.95-4.1-4-8.75-10.8-11)
Media: 5
Mediana: 3,9
En este caso la Media y la Mediana ya no se parecen en nada.
Esto sucede porque hay valores muy extremos, lechones que apenas alcanzan los 2 kg y los tres últimos que superan los 9.
¿Qué se acerca más a la realidad, la media o la mediana?
En la camada B, donde los valores son muy dispares, la mediana se acerca más a la realidad. Tengo una mayoría de lechones pequeños y 3 muy grandes.
¿Con qué camada os quedaríais vosotros?
Si yo os hago elegir tan solo por la media, os quedaríais con cualquiera de las dos, ya que las dos camadas tienen una media de peso a destete exactamente igual. ¿Pero verdad que cambiaríais de opinión si os dijera la mediana?
Situaciones en las que deberíamos escoger la Mediana:
La primera, cuando los datos no se ajustan a una distribución normal es más correcto utilizar la mediana. Esto es así porque la mediana es mucho más robusta, lo que quiere decir que se afecta menos por la presencia de sesgos en la distribución o de valores extremos.
La segunda tiene que ver con lo anterior. Cuando haya valores muy extremos la mediana informará mejor del punto central de la distribución que la media, que tiene el defecto de desviarse hacia los valores extremos, tanto más cuanto más extremos son.
Por último, algunos dicen que con algunas variables tiene más sentido utilizar mediana que media. Por ejemplo, si hablamos de supervivencia, la mediana nos informa sobre el tiempo de supervivencia, pero también sobre cuánto sobrevive la mitad de la muestra, por lo que sería más informativa que la media aritmética.
Y entonces, ¿ya no usamos nunca más la media?
Si a todos los valores de la variable se le suma una misma cantidad, la media aritmética queda aumentada en dicha cantidad.
Si todos los valores de la variable se multiplican por una misma constante la media aritmética queda multiplicada por dicha constante:
En definitiva, ¿media o mediana?
Mi consejo es que ante valores de distribución normal podéis seguir usando la media con tranquilidad, pero si la muestra tiene una distribución heterogénea, no.
¿Y si no sabemos si es homogénea o no?
En este caso es una buena práctica mirar ambas medidas (la mediana la encontraréis en las fórmulas estadísticas de excel), si coinciden quiere decir que la muestra es homogénea, si no coinciden, la Mediana será más representativa de la realidad muestral
Suscribete ahora a la revista técnica porcina
AUTORES
Fallos en bioseguridad en explotaciones porcinas – Reproductoras y L&D
Fernando Laguna AránAuge del virus de la encefalitis japonesa en nuevas regiones australianas
Servicios Veterinarios Grup de Sanejament Porcí de Lleida (GSP)El papel de los acidificantes en la salud intestinal del lechón
Alberto Morillo AlujasClaves del manejo de la cerda hiperprolífica
Luis SanjoaquínSumando esfuerzos: por un futuro sin ZnO
Tras las huellas del Chato Murciano – ¡Del Chato hasta los andares!
Ángel Poto Remacha Begoña Peinado Ramón Laura Almela Veracruz Sonia Galán ArnaldosFenotipado de precisión en un núcleo genético de selección porcina
Aida Osuna Nevado¿Las tecnologías inteligentes en explotaciones porcinas conducen a respuestas inteligentes?
Franck L. B. Meijboom Mona F. GiersbergInvolucrando a los diferentes sectores en la prevención de la Peste Porcina Africana – Actividades del Grupo Operativo PREVPA
Andrés Paredes Arturo Hernangómez Cristina Marí Daniel Hernández Eduardo Laguna Gonzalo Varas Jaime Hurtado Jesús Pérez Joaquín Vicente Juan Pascual Herrera Luis Fernando Villanueva Manuel González María Teresa González Pelayo Acevedo Santiago Carretero Saúl Jiménez-Ruiz Vidal MontoroI-Farms, la granja inteligente de New Farms
Análisis del agua dentro de la producción porcina
Gema Chacón Marta FerrerEl papel de la Influenza en el complejo respiratorio de origen multifactorial
Sara Crespo Vicente10 Reglas para un programa integral de control de PRRS: El modelo del queso suizo – Parte 1
Carmen Alonso Marius KunzeAproximación diagnostica y alternativas para monitorizar el PRRSV
Pablo PineyroPrecios, regulaciones y medio ambiente – Impulsos que obligan a la eficiencia energética
Andrea Costantino Salva CalvetCambio de paradigma con el fin del ZnO en el pienso para lechones
¿Ha llegado la hora de revisar las fases de transición y engorde de cerdos? – Parte 2
Ricardo SegundoNuestra visión holística – Los programas Naturwean y los suplementos nutricionales Adicare