Empecé a aprender estadísticas hace unas semanas, bueno, mi pregunta es que, como sabemos, la media, la mediana y la moda son la tendencia central de los datos y sugiere que no deberíamos ir con solo una de estas medidas ya que pocas circunstancias pueden afectarlos bien lo que deberíamos considerar la tendencia central de los datos si su media, mediana y moda cuentan una historia completamente diferente sobre los datos
ejemplo
mean = 43.26 median = 14 and mode = 9
y mi pregunta es ¿qué debemos interpretar a partir de estas medidas cuál sería la mejor estimación para la central tendencia
Comentarios
- Parece muy extraño citar el consejo y luego preguntar " cuál " debería utilizar. ¿Qué parte del consejo " don ' t ir con solo uno de ellos " es confuso?. Si
no es confuso, ¿por qué entonces elegir " ir con " solo uno?
Responder
Diferentes situaciones requieren diferentes respuestas. Los estadísticos aplicados deben encontrar la medida que responda mejor a la pregunta subyacente.
Considere la siguiente oración:
La mayoría de las personas tienen un número superior al promedio de piernas
La mayoría de las personas tienen 2 piernas, algunas tienen solo una o ninguna. Entonces la media es probablemente 1.9 …
Si alguien en la calle te pregunta «¿Cuántas piernas tiene la gente?» normalmente esperan la respuesta «dos patas», que es el modo . El modo es a menudo «lo normal». Sin embargo, si estuviera en una posición en la que tuviera que planificar un stock de prótesis de miembros inferiores para un país lejano, querría multiplicar la mean con el tamaño de la población. En muchos casos en los que le gustaría evaluar una media de una muestra pequeña pero tiene miedo de valores atípicos, la mediana será una mejor estimador.
Por lo tanto, la pregunta de cuál es la mejor medida no es una pregunta matemática universal ni depende necesariamente de lo que mida, sino de cualquier problema del mundo real que intente abordar.
Respuesta
En mi opinión, la respuesta debería depender de su forma de distribución. Por ejemplo, si tiene una densidad en forma de campana, puede considerar usar la media como un estimador informativo. Si tiene un poco de valores atípicos o tiene una distribución sesgada o su distribución no tiene una media bien definida, puede usar la mediana. Si tiene una distribución multimodal, puede usar el modo.
Todos estos estimadores son esencialmente diferentes y brindan información diferente sobre su variable aleatoria subyacente.
Otra cosa que vale la pena discutir ( excepto las profundas diferencias subyacentes en lo que significan estos estimadores) es la eficiencia de la estimación y el punto de ruptura. La media es el estimador más eficiente (su estimación será lo más cercana al valor real usando la muestra de tamaño que tenga). La mediana es mucho más sólida (tiene un punto de ruptura de casi el 50%), pero mucho menos eficaz. El estimador de Lehman-Hodges se encuentra en algún punto intermedio. El modo, que a menudo se obtiene a través de la estimación de la densidad del núcleo, no es eficiente en absoluto y tiene sentido usarlo solo si tiene> 50% de «valores atípicos»; incluso en este caso, debe tener mucho cuidado con el núcleo que que usa, por ejemplo, el kernel predeterminado en R se mantiene allí por razones históricas y no debe usarse.
Éstas son mi opinión y pueden estar equivocadas.
Crédito de la imagen: https://www.tutor2u.net/geography/reference/mean-median-and-mode