Cum se calculează a patra quartilă din mediană și IQR?

Cum pot calcula a patra quartilă din mediană și IQR. Într-un articol științific, am acele valori:

  • Mediana este de 2,8 ng / ml de bisfenol A și
  • Intervalul intercuartil, au scris că 1,5-5,6.

Pot concluziona că

  • prima quartilă este 1,5
  • a doua quartilă 2.8
  • și a treia quartile 5.6?

Dacă este ok, înțeleg, dar trebuie să recalculez pentru a avea patru quartile. Ma poti ajuta?

Comentarii

  • vezi răspunsul lui Ferdi ', dar ești sigur că vrei să spui al patrulea quartile ca un număr? Ar fi în esență valoarea maximă.
  • Puteți clarifica ce înțelegeți prin a patra quartilă? În mod normal, există doar $ q – 1 $ $ q $ -quantile diferite (trei quartile, patru quintile, nouă decile etc), cu excepția cazului în care ' vă referiți la intervalele pe care le separă quartile. (Dacă numărați cea mai mare valoare ca a patra quartilă, ' veți număra și cea mai mică observație ca zero-th și acolo ' să fie $ q + 1 $ atunci, nu $ 1 $.) A se vedea a doua teză din al doilea paragraf aici și acest articol .
  • Valorile din a treia quartilă ca un set de numere (mai degrabă decât un punct) s-ar putea spune că sunt cuprinse între 2,8 $ și 5,6 $. Deci, în același mod, valorile din a patra quartilă s-ar putea spune că merg de la $ 5,6 $ în sus

Răspuns

Notă: În răspunsul următor presupun că știți numai cuantilele pe care le-ați menționat și nu știți nimic altceva despre distribuție, de exemplu, nu știți dacă distribuția este simetrică sau care este pdf-ul sau momentele sale (centralizate) are.


Nu este posibil să calculați a patra quartilă, dacă aveți doar mediana și IQR.

Să ne uităm la următoarele definiții:

median = al doilea quartile.

IQR = al treilea quartile $ – $ prima quartile.

Al patrulea quartile nu se află în niciuna dintre aceste două ecuații. Prin urmare, este imposibil să o calculăm cu informațiile date.


Iată un exemplu:

 x <- c(1,2,3,4,5,6,7,8,9,10) y <- c(1,2,3,4,5,6,7,8,9,20) summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 5.50 7.75 10.00 summary(y) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 6.50 7.75 20.00 

Primul quartile este atât pentru „x”, cât și pentru „y” 3,25. De asemenea, mediana este de 5,5 pentru ambele. A treia quartilă este de 7,75 pentru ambele, iar IQR este de 7,75 USD – 3,25 USD = 4,5 pentru ambele. Cu toate acestea, a patra quartilă, care este și cea maximă, este diferită, și anume 10 și 20.


Puteți, de asemenea, să vă uitați la graficele box de x și y și veți vedea că prima quartilă, a doua quartilă (mediană) și a treia quartilă sunt egale. Prin urmare, nu puteți concluziona nimic despre restul distribuției punctelor de date.

df <- data.frame(x,y) p <- ggplot(stack(df), aes(x = ind, y = values)) + geom_boxplot() p 

introduceți descrierea imaginii aici

Comentarii

  • O excepție ar fi dacă distribuția este cunoscută de fie simetric. În acest caz, quartile sunt IQR / 2 de ambele părți ale medianei.
  • Punct bun. L-am inclus în răspunsul meu.
  • Bine !! Inteleg acum !! De fapt, am fost confuz
  • Simțiți-vă liber să acceptați unul dintre răspunsuri.

Răspuns

@Ferdi este corect, dar cred că puneți întrebarea greșită. Cred că ești confuz, deoarece „quartile” pare să însemne „4 din ceva”. Există, într-adevăr, 4 grupuri. Dar asta înseamnă că există 3 divizii și, cel puțin în ceea ce am citit, nu se folosește deloc termenul al patrulea quartilă (ca număr). Dacă calculezi al patrulea quartilă ca număr, atunci ai vrea și tu al patrulea quartil, care ar fi minimul. Dar nu cred că asta vrei tu.

În cazul în care acest lucru nu este clar, imaginea tăiați un dreptunghi în 4 dreptunghiuri. Aveți nevoie de trei tăieturi pentru a face patru dreptunghiuri.

Dacă v-am acuzat greșit că sunteți confuz, am îmi cer scuze, dar am văzut această confuzie de mai multe ori.

Comentarii

  • Așa este ', sigur sunt confuz

Răspuns

Prima quartilă are 25% din datele de sub ea, a 2-a quartilă = mediană are 50% din date sub ea, a treia quartilă are 75% date sub și 25% peste. IQR = quartile 3rd – 1st quartile. O a patra quartilă ar fi cea maximă, pe care nu o puteți obține din mediană și IQR. IQR și mediana vă spun foarte puțin despre forma distribuției. S-ar putea să faceți o estimare dacă știți forma distribuției. , dar pentru multe distribuții răspunsul va fi infinit. Bănuiesc că al treilea quartile este ceea ce vrei cu adevărat.Dacă aveți IQR și median și cunoașteți forma distribuției , puteți estima a treia quartilă: de ex. mediană plus jumătate din IQR pentru o distribuție simetrică. Cu toate acestea, multe distribuții nu sunt simetrice. De asemenea, aveți grijă în cazul în care vi s-a acordat o gamă semi intercuartilă mai degrabă decât IQR.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *