Comment calculer le 4e quartile à partir de la médiane et de lIQR?

Comment puis-je calculer le 4e quartile à partir de la médiane et de lIQR. Dans un article scientifique, jai ces valeurs:

  • La médiane est de 2,8 ng / ml de bisphénol A et
  • Lintervalle interquartile, ils ont écrit que 1,5-5,6.

Puis-je conclure que

  • le premier quartile est 1,5
  • le deuxième quartile 2,8
  • et le troisième quartile 5,6?

Si cest ok, je comprends, mais je dois recalculer pour avoir quatre quartiles. Pouvez-vous maider?

Commentaires

  • voir la réponse de Ferdi ', mais êtes-vous sûr que vous entendez le 4e quartile comme un numéro? Ce serait essentiellement la valeur maximale.
  • Pouvez-vous préciser ce que vous entendez par le quatrième quartile? Il ny a normalement que des $ q – 1 $ différents $ q $ -quantiles (trois quartiles, quatre quintiles, neuf déciles, etc.) à moins que vous ne vous référiez ' aux intervalles que les quartiles séparent. (Si vous comptez la plus grande valeur comme le quatrième quartile, vous ' compter également la plus petite observation comme le zéro-ème, et là ' d soit $ q + 1 $ alors, pas $ 1 $.) Voir la deuxième phrase du deuxième paragraphe ici et cet article .
  • Les valeurs du troisième quartile sous forme dun ensemble de nombres (plutôt quun point) peuvent être considérées comme comprises entre 2,8 $ $ et 5,6 $ $. Ainsi, de la même manière, on peut dire que les valeurs du quatrième quartile vont de 5,6 $ vers le haut

Answer

Note: Dans la réponse suivante je suppose que vous ne connaissez que les quantiles que vous avez mentionnés et que vous ne savez rien dautre sur la distribution, par exemple vous ne savez pas si la distribution est symétrique ou quel est son pdf ou ses moments (centralisés) sont.


Il nest pas possible de calculer le 4e quartile, si vous navez que la médiane et lIQR.

Regardons les définitions suivantes:

median = second quartile.

IQR = troisième quartile $ – $ premier quartile.

Le quatrième quartile nest dans aucune de ces deux équations. Par conséquent, il est impossible de le calculer avec les informations données.


Voici un exemple:

 x <- c(1,2,3,4,5,6,7,8,9,10) y <- c(1,2,3,4,5,6,7,8,9,20) summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 5.50 7.75 10.00 summary(y) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 6.50 7.75 20.00 

Le premier quartile est à la fois pour « x » et « y » 3,25. La médiane est également de 5,5 pour les deux. Le troisième quartile est de 7,75 pour les deux et lIQR est de 7,75 $ – 3,25 $ = 4,5 pour les deux. Cependant, le 4e quartile, qui est aussi le maximum, est différent, à savoir 10 et 20.


Vous pouvez également regarder les boîtes à moustaches de x et y et vous verrez que le premier quartile, le le deuxième quartile (médiane) et le troisième quartile sont égaux. Par conséquent, vous ne pouvez rien conclure sur le reste de la distribution des points de données.

df <- data.frame(x,y) p <- ggplot(stack(df), aes(x = ind, y = values)) + geom_boxplot() p 

entrez la description de limage ici

Commentaires

  • Une exception serait si la distribution est connue de être symétrique. Dans ce cas, les quartiles sont IQR / 2 de chaque côté de la médiane.
  • Bon point. Je lai inclus dans ma réponse.
  • Très bien !! Je comprends maintenant !! Jai été confus en fait
  • Nhésitez pas à accepter lune des réponses.

Réponse

@Ferdi a raison, mais je pense que vous posez la mauvaise question. Je pense que vous êtes confus parce que « quartile » semble vouloir dire « 4 de quelque chose ». Il existe en effet 4 groupes. Mais cela signifie quil y a 3 divisions et, au moins dans ce que jai lu, le terme 4e quartile (en nombre) nest pas du tout utilisé. Si vous calculez le 4e quartile comme un nombre, alors vous voulez également le 0e quartile, ce qui serait le minimum. Mais je ne pense pas que ce soit ce que vous voulez.

Dans le cas où cela ne serait pas clair, image coupant un rectangle en 4 rectangles. Vous avez besoin de trois coupes pour faire quatre rectangles.

Si je vous ai accusé à tort dêtre confus, je excusez-vous, mais jai vu cette confusion plus dune fois.

Commentaires

  • Que ' a raison, je suis sûrement confus

Réponse

Le premier quartile contient 25% des données en dessous, le 2e quartile = la médiane a 50% des données en dessous, troisième quartile a 75% de données ci-dessous et 25% au-dessus. IQR = 3e quartile – 1er quartile. Un quatrième quartile serait le maximum, que vous ne pouvez pas obtenir à partir de la médiane et du QI. Le QI et la médiane vous en disent très peu sur la forme de la distribution. Vous pourrez peut-être faire une estimation si vous connaissez la forme de la distribution. , mais pour de nombreuses distributions, la réponse sera linfini. Je soupçonne que le troisième quartile est ce que vous voulez vraiment.Si vous avez lIQR et la médiane et que vous connaissez la forme de la distribution , vous pourrez peut-être estimer le troisième quartile: par exemple médiane plus la moitié de lIQR pour une distribution symétrique. Cependant, de nombreuses distributions ne sont pas symétriques. Faites également attention au cas où vous auriez reçu lintervalle semi-interquartile plutôt que lIQR.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *