Hvordan kan jeg beregne 4. kvartil fra median og IQR. I en vitenskapelig artikkel har jeg disse verdiene:
- Medianen er 2,8 ng / ml bisfenol A og
- Interkvartilområdet, de skrev at 1,5-5,6.
Kan jeg konkludere med at
- første kvartil er 1,5
- andre kvartil 2.8
- og det tredje kvartil 5.6?
Hvis det er ok, forstår jeg det, men jeg må beregne på nytt for å ha fire kvartiler. Kan du hjelpe meg?
Kommentarer
- se Ferdi ' s svar, men er du sikker på at du mener den fjerde kvartilen som et tall? Det ville egentlig være den maksimale verdien.
- Kan du avklare hva du mener med fjerde kvartil? Det er normalt bare $ q – 1 $ forskjellige $ q $ -kvantiler (tre kvartiler, fire kvintiler, ni desiler osv.) Med mindre du ' refererer til intervallene som kvartilene skiller. (Hvis du teller den største verdien som fjerde kvartil, teller du ' d også den minste observasjonen som null-th, og der ' d være $ q + 1 $ da, ikke $ 1 $.) Se andre setning i andre ledd her og denne artikkelen .
- Verdier i tredje kvartil som et sett med tall (i stedet for et punkt) kan sies å være mellom $ 2,8 $ til $ 5,6 $. Så på samme måte kan det sies at verdier i fjerde kvartil går fra $ 5,6 $ oppover
Svar
Merk: I det følgende svaret antar jeg at du bare kjenner til kvantilene du nevnte, og at du ikke vet noe annet om fordelingen, for eksempel vet du ikke om fordelingen er symmetrisk eller hva dens pdf eller dens (sentraliserte) øyeblikk er.
Det er ikke mulig å beregne 4. kvartil, hvis du bare har medianen og IQR.
La oss se på følgende definisjoner:
median = andre kvartil.
IQR = tredje kvartil $ – $ første kvartil.
4. kvartil er i ingen av disse to ligningene. Derfor er det umulig å beregne det med gitt informasjon.
Her er ett eksempel:
x <- c(1,2,3,4,5,6,7,8,9,10) y <- c(1,2,3,4,5,6,7,8,9,20) summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 5.50 7.75 10.00 summary(y) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 6.50 7.75 20.00
Den første kvartilen er for både «x» og «y» 3,25. Også medianen er 5,5 for begge. Den tredje kvartilen er 7,75 for begge og IQR er 7,75 $ – $ 3,25 = 4,5 for begge. Den fjerde kvartilen, som også er maksimum, er imidlertid forskjellig, nemlig 10 og 20.
Du kan også se på boksplottene av x og y, og du vil se at den første kvartilen, andre kvartil (median) og tredje kvartil er like. Derfor kan du ikke konkludere med noe om resten av distribusjonen av datapunktene.
df <- data.frame(x,y) p <- ggplot(stack(df), aes(x = ind, y = values)) + geom_boxplot() p
Kommentarer
- Et unntak vil være hvis distribusjonen er kjent for være symmetrisk. I så fall er kvartilene IQR / 2 på hver side av medianen.
- Bra poeng. Jeg inkluderte det i svaret mitt.
- Greit !! Jeg forstår nå !! Jeg har faktisk vært forvirret
- Godta gjerne et av svarene.
Svar
@Ferdi er riktig, men jeg tror at du stiller feil spørsmål. Jeg tror du er forvirret fordi «kvartil» ser ut til å bety «4 av noe». Det er faktisk fire grupper. Men det betyr at det er 3 divisjoner, og i det minste i det jeg har lest, brukes ikke begrepet 4. kvartil (som et tall) i det hele tatt. Hvis du regner ut 4. kvartil som et tall, vil du også den 0. kvartilen, som ville være minimum. Men jeg tror ikke det er det du vil ha.
Hvis det ikke er klart, kan du kutte et rektangel i fire rektangler. Du trenger tre kutt for å lage fire rektangler.
Hvis jeg feilaktig har anklaget deg for å være forvirret, beklager, men jeg har sett denne forvirringen mer enn en gang.
Kommentarer
- At ' stemmer, jeg er sikkert forvirret
Svar
Den første kvartilen har 25% av dataene under seg, 2. kvartil = median har 50% av data under seg, tredje kvartil har 75% data under og 25% over. IQR = 3. kvartil – 1. kvartil. En fjerde kvartil ville være det maksimale, som du ikke kan få fra medianen og IQR. IQR og median forteller deg veldig lite om formen på fordelingen. Du kan kanskje gjøre et estimat hvis du vet formen på fordelingen , men for mange distribusjoner vil svaret være uendelig. Jeg mistenker at tredje kvartil er det du virkelig vil ha.Hvis du har IQR og median og vet formen på fordelingen , kan du kanskje estimere tredje kvartil: f.eks. median pluss halvparten av IQR for en symmetrisk fordeling. Imidlertid er mange distribusjoner ikke symmetriske. Vær også forsiktig hvis du har fått det semi-interkvartile området i stedet for IQR.