¿Cómo puedo calcular el cuarto cuartil a partir de la mediana y el IQR? En un artículo científico, tengo esos valores:
- La mediana es 2.8 ng / ml de bisfenol A y
- El rango intercuartílico, escribieron que 1.5-5.6.
¿Puedo concluir que
- el primer cuartil es 1.5
- el segundo cuartil 2.8
- y el tercero cuartil 5.6?
Si está bien, lo entiendo, pero necesito recalcular para tener cuatro cuartiles. ¿Me puedes ayudar?
Comentarios
- vea la respuesta de Ferdi ', pero ¿está seguro de que se refiere al cuarto cuartil como ¿un número? Básicamente, sería el valor máximo.
- ¿Puede aclarar qué quiere decir con el cuarto cuartil? Normalmente hay $ q – 1 $ diferentes $ q $ -cuantiles (tres cuartiles, cuatro quintiles, nueve deciles, etc.) a menos que ' se refiera a los intervalos que separan los cuartiles. (Si cuenta el valor más grande como el cuarto cuartil, ' d también cuenta la observación más pequeña como el cero-ésimo, y allí ' d sea $ q + 1 $ entonces, no $ 1 $.) Vea la segunda oración del segundo párrafo aquí y este artículo .
- Se podría decir que los valores en el tercer cuartil como un conjunto de números (en lugar de un punto) están entre $ 2.8 $ y $ 5.6 $. Entonces, de la misma manera, se podría decir que los valores en el cuarto cuartil van desde $ 5.6 $ hacia arriba
Respuesta
Nota: En la siguiente respuesta, supongo que solo conoce los cuantiles que mencionó y no sabe nada más sobre la distribución, por ejemplo, no sabe si la distribución es simétrica o cuál es su pdf o sus momentos (centralizados) son.
No es posible calcular el cuarto cuartil, si solo tiene la mediana y el IQR.
Veamos las siguientes definiciones:
median = segundo cuartil.
IQR = tercer cuartil $ – $ primer cuartil.
El cuarto cuartil no está en ninguna de estas dos ecuaciones. Por lo tanto, es imposible calcularlo con la información proporcionada.
Aquí hay un ejemplo:
x <- c(1,2,3,4,5,6,7,8,9,10) y <- c(1,2,3,4,5,6,7,8,9,20) summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 5.50 7.75 10.00 summary(y) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 6.50 7.75 20.00
El primer cuartil es para «x» e «y» 3,25. Además, la mediana es de 5,5 para ambos. El tercer cuartil es 7.75 para ambos y el IQR es 7.75 $ – $ 3.25 = 4.5 para ambos. Sin embargo, el cuarto cuartil, que también es el máximo, es diferente, es decir, 10 y 20.
También puedes mirar diagramas de caja de xey y verás que el primer cuartil, el el segundo cuartil (mediana) y el tercer cuartil son iguales. Por lo tanto, no puede concluir nada sobre el resto de la distribución de los puntos de datos.
df <- data.frame(x,y) p <- ggplot(stack(df), aes(x = ind, y = values)) + geom_boxplot() p
Comentarios
- Una excepción sería si se sabe que la distribución ser simétrico. En ese caso, los cuartiles son IQR / 2 a cada lado de la mediana.
- Buen punto. Lo incluí en mi respuesta.
- ¡¡Muy bien !! Entiendo ahora !! De hecho, he estado confundido
- Siéntase libre de aceptar una de las respuestas.
Responder
@Ferdi tiene razón, pero creo que estás haciendo la pregunta incorrecta. Creo que estás confundido porque «cuartil» parece significar «4 de algo». De hecho, hay 4 grupos. Pero eso significa que hay 3 divisiones y, al menos en lo que he leído, el término cuarto cuartil (como un número) no se usa en absoluto. Si calcula el cuarto cuartil como un número, entonces también querrá el cuartil 0, que sería el mínimo. Pero no creo que eso sea lo que quieres.
En caso de que no esté claro, imagínese cortando un rectángulo en 4 rectángulos. Necesita tres cortes para hacer cuatro rectángulos.
Si lo he acusado erróneamente de estar confundido, Disculpe, pero he visto esta confusión más de una vez.
Comentarios
- Eso ' es correcto, seguramente estoy confundido
Respuesta
El primer cuartil tiene el 25% de los datos debajo, el segundo cuartil = mediana tiene el 50% de los datos debajo, tercer cuartil tiene un 75% de datos por debajo y un 25% por encima. IQR = 3er cuartil – 1er cuartil. Un cuarto cuartil sería el máximo, que no se puede obtener de la mediana y el IQR. El IQR y la mediana le dicen muy poco sobre la forma de la distribución. Es posible que pueda hacer una estimación si conoce la forma de la distribución. , pero para muchas distribuciones la respuesta será infinita. Sospecho que el tercer cuartil es lo que realmente quieres.Si tiene el IQR y la mediana y conoce la forma de la distribución , es posible que pueda estimar el tercer cuartil: p. Ej. mediana más la mitad del IQR para una distribución simétrica. Sin embargo, muchas distribuciones no son simétricas. Además, tenga cuidado en caso de que le hayan dado el rango semi intercuartílico en lugar del IQR.