Como posso calcular o 4º quartil a partir da mediana e IQR. Em um artigo científico, tenho esses valores:
- A mediana é 2,8 ng / ml de bisfenol A e
- O intervalo interquartil, eles escreveram que 1,5-5,6.
Posso concluir que
- o primeiro quartil é 1,5
- o segundo quartil 2.8
- e o terceiro quartil 5.6?
Se estiver ok, entendo, mas preciso recalcular para ter quatro quartis. Pode me ajudar?
Comentários
- veja a resposta de Ferdi ', mas tem certeza de que quer dizer o 4º quartil como um número? Seria essencialmente o valor máximo.
- Você pode esclarecer o que você quer dizer com o quarto quartil? Normalmente existem apenas $ q – 1 $ $ q $ -quantis diferentes (três quartis, quatro quintis, nove decis, etc.), a menos que você ' se refira aos intervalos que os quartis separam. (Se você contar o maior valor como o quarto quartil, ' d também contará a menor observação como o zero-th, e há ' d seja $ q + 1 $ então, não $ 1 $.) Veja a segunda frase do segundo parágrafo aqui e este artigo .
- Os valores no terceiro quartil como um conjunto de números (em vez de um ponto) podem ser considerados entre $ 2,8 $ a $ 5,6 $. Portanto, da mesma forma, pode-se dizer que os valores no quarto quartil vão de $ 5,6 $ para cima
Resposta
Nota: na seguinte resposta eu suponho que você conhece apenas os quantis que você mencionou e você não sabe mais nada sobre a distribuição, por exemplo, você não sabe se a distribuição é simétrica ou qual seu pdf ou seus momentos (centralizados) são.
Não é possível calcular o 4º quartil, se você tiver apenas a mediana e o IQR.
Vejamos as seguintes definições:
mediana = segundo quartil.
IQR = terceiro quartil $ – $ primeiro quartil.
O quarto quartil não está em nenhuma dessas duas equações. Portanto, é impossível calculá-lo com as informações fornecidas.
Aqui está um exemplo:
x <- c(1,2,3,4,5,6,7,8,9,10) y <- c(1,2,3,4,5,6,7,8,9,20) summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 5.50 7.75 10.00 summary(y) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 6.50 7.75 20.00
O primeiro quartil é para “x” e “y” 3,25. Além disso, a mediana é de 5,5 para ambos. O terceiro quartil é 7,75 para ambos e o IQR é 7,75 $ – $ 3,25 = 4,5 para ambos. No entanto, o 4º quartil, que também é o máximo, é diferente, a saber, 10 e 20.
Você também pode olhar os boxplots de xey e verá que o primeiro quartil, o o segundo quartil (mediana) e o terceiro quartil são iguais. Portanto, você não pode concluir nada sobre o resto da distribuição dos pontos de dados.
df <- data.frame(x,y) p <- ggplot(stack(df), aes(x = ind, y = values)) + geom_boxplot() p
Comentários
- Uma exceção seria se a distribuição fosse conhecida por seja simétrico. Nesse caso, os quartis são IQR / 2 em cada lado da mediana.
- Bom argumento. Eu incluí na minha resposta.
- Tudo bem !! Eu entendo agora !! Na verdade, estou confuso
- Sinta-se à vontade para aceitar uma das respostas.
Resposta
@Ferdi está correto, mas acho que você está fazendo a pergunta errada. Acho que você está confuso porque “quartil” parece significar “4 de alguma coisa”. Existem, de fato, 4 grupos. Mas isso significa que há 3 divisões e, pelo menos no que eu li, o termo 4º quartil (como um número) não é usado. Se você calcular o 4º quartil como um número, então você também vai querer o 0º quartil, que seria o mínimo. Mas não acho que seja isso que você quer.
Caso não esteja claro, imagine cortando um retângulo em 4 retângulos. Você precisa de três cortes para fazer quatro retângulos.
Se eu o acusei injustamente de estar confuso, eu peço desculpas, mas já vi essa confusão mais de uma vez.
Comentários
- Isso ' está certo, certamente estou confuso
Resposta
O primeiro quartil tem 25% dos dados abaixo dele, o 2º quartil = mediana tem 50% dos dados abaixo, terceiro quartil tem 75% de dados abaixo e 25% acima. IQR = 3º quartil – 1º quartil. Um quarto quartil seria o máximo, que você não pode obter com a mediana e IQR. IQR e mediana dizem muito pouco sobre a forma da distribuição. Você pode ser capaz de fazer uma estimativa se souber a forma da distribuição , mas para muitas distribuições a resposta será infinita. Suspeito que o terceiro quartil é o que você realmente deseja.Se você tiver o IQR e a mediana e conhecer a forma da distribuição , poderá estimar o terceiro quartil: por exemplo, mediana mais metade do IQR para uma distribuição simétrica. No entanto, muitas distribuições não são simétricas. Além disso, tome cuidado no caso de ter sido fornecido o intervalo semi-interquartil em vez do IQR.