Hvordan beregnes 4. kvartil fra median og IQR?

Hvordan kan jeg beregne 4. kvartil ud fra median og IQR. I en videnskabelig artikel har jeg disse værdier:

  • Medianen er 2,8 ng / ml bisphenol A og
  • Interkvartilområdet, de skrev at 1,5-5,6.

Kan jeg konkludere, at

  • det første kvartil er 1,5
  • det andet kvartil 2.8
  • og det tredje kvartil 5.6?

Hvis det er ok, forstår jeg det, men jeg skal genberegne for at have fire kvartiler. Kan du hjælpe mig?

Kommentarer

  • se Ferdi ' s svar, men er du sikker på at du mener 4. kvartil som et nummer? Det ville i det væsentlige være den maksimale værdi.
  • Kan du præcisere, hvad du mener med det fjerde kvartil? Der er normalt kun $ q – 1 $ forskellige $ q $ -kvantiler (tre kvartiler, fire kvintiler, ni deciler osv.), Medmindre du ' henviser til de intervaller, som kvartilerne adskiller. (Hvis du tæller den største værdi som den fjerde kvartil, tæller du ' d også den mindste observation som nul-th, og der ' d være $ q + 1 $ så ikke $ 1 $.) Se andet punktum i andet afsnit her og denne artikel .
  • Værdier i tredje kvartil som et sæt tal (snarere end et punkt) kan siges at være mellem $ 2,8 $ til $ 5,6 $. Så på samme måde kan værdier i fjerde kvartil siges at gå fra $ 5,6 $ opad

Svar

Bemærk: I det følgende svar antager jeg, at du kun kender de kvantiler, du nævnte, og at du ikke ved noget andet om fordelingen, for eksempel ved du ikke, om fordelingen er symmetrisk eller hvad dens pdf eller dens (centraliserede) øjeblikke er.


Det er ikke muligt at beregne 4. kvartil, hvis du kun har medianen og IQR.

Lad os se på følgende definitioner:

median = andet kvartil.

IQR = tredje kvartil $ – $ første kvartil.

4. kvartil er i ingen af disse to ligninger. Derfor er det umuligt at beregne det med de givne oplysninger.


Her er et eksempel:

 x <- c(1,2,3,4,5,6,7,8,9,10) y <- c(1,2,3,4,5,6,7,8,9,20) summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 5.50 7.75 10.00 summary(y) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 6.50 7.75 20.00 

Den første kvartil er for både “x” og “y” 3,25. Medianen er også 5,5 for begge. Den tredje kvartil er 7,75 for begge og IQR er 7,75 $ – $ 3,25 = 4,5 for begge. Den 4. kvartil, som også er maksimum, er forskellig, nemlig 10 og 20.


Du kan også se på boksploterne med x og y, og du vil se, at den første kvartil, andet kvartil (median) og det tredje kvartil er ens. Derfor kan du ikke konkludere noget om resten af distributionen af datapunkterne.

df <- data.frame(x,y) p <- ggplot(stack(df), aes(x = ind, y = values)) + geom_boxplot() p 

indtast billedebeskrivelse her

Kommentarer

  • En undtagelse ville være, hvis distributionen er kendt for være symmetrisk. I så fald er kvartilerne IQR / 2 på begge sider af medianen.
  • Godt punkt. Jeg inkluderede det i mit svar.
  • Okay !! Jeg forstår nu !! Jeg er faktisk forvirret
  • Acceptér gerne et af svarene.

Svar

@Ferdi er korrekt, men jeg tror, at du stiller det forkerte spørgsmål. Jeg tror, du er forvirret, fordi “kvartil” synes at betyde “4 af noget”. Der er faktisk 4 grupper. Men det betyder, at der er 3 inddelinger, og i det mindste i det, jeg har læst, bruges udtrykket 4. kvartil (som et tal) slet ikke. Hvis du beregner 4. kvartil som et tal, så vil du også have det 0. kvartil, hvilket ville være minimumet. Men jeg tror ikke, det er, hvad du vil have.

Hvis det ikke er klart, kan du skære et rektangel i fire rektangler. Du har brug for tre snit for at lave fire rektangler.

Hvis jeg fejlagtigt har beskyldt dig for at være forvirret, jeg undskyld, men jeg har set denne forvirring mere end én gang.

Kommentarer

  • At ' er rigtigt, jeg er helt sikkert forvirret

Svar

Den første kvartil har 25% af dataene under sig, 2. kvartil = median har 50% af data under sig, tredje kvartil har 75% data under og 25% over. IQR = 3. kvartil – 1. kvartil. En fjerde kvartil ville være det maksimale, som du ikke kan få fra medianen og IQR. IQR og medianen fortæller dig meget lidt om fordelingen. Du kan muligvis lave et skøn, hvis du kender fordelingsformen , men for mange distributioner vil svaret være uendelig. Jeg formoder, at tredje kvartil er, hvad du virkelig vil have.Hvis du har IQR og median og kender fordelingenes form , kan du muligvis estimere den tredje kvartil: f.eks. median plus halvdelen af IQR for en symmetrisk fordeling. Imidlertid er mange distributioner ikke symmetriske. Vær også forsigtig, hvis du har fået det semi-interkvartile interval i stedet for IQR.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *