Jak obliczyć czwarty kwartyl na podstawie mediany i IQR. W artykule naukowym mam następujące wartości:
- Mediana to 2,8 ng / ml bisfenolu A i
- Rozstęp międzykwartylowy, napisali, że 1,5-5,6.
Czy mogę stwierdzić, że
- pierwszy kwartyl to 1,5
- drugi kwartyl 2,8
- a trzeci kwartyl 5.6?
Jeśli wszystko jest w porządku, rozumiem, ale muszę przeliczyć, aby uzyskać cztery kwartyle. Możesz mi pomóc?
Komentarze
- zobacz odpowiedź Ferdiego ', ale czy na pewno masz na myśli czwarty kwartyl jako numer? Zasadniczo byłaby to wartość maksymalna.
- Czy możesz wyjaśnić, co rozumiesz przez czwarty kwartyl? Zwykle istnieje tylko $ q – 1 $ różnych $ q $ -kwantyli (trzy kwartyle, cztery kwintyle, dziewięć decyli itd.), Chyba że ' odnosimy się do przedziałów rozdzielonych kwartylami. (Jeśli policzysz największą wartość jako czwarty kwartyl, ' d również policzysz najmniejszą obserwację jako zero, a wtedy ' d będzie $ q + 1 $, a nie $ 1 $.) Zobacz drugie zdanie drugiego akapitu tutaj i ten artykuł .
- Można powiedzieć, że wartości w trzecim kwartylu jako zbiór liczb (zamiast kropki) mieszczą się w przedziale od 2,8 USD do 5,6 USD. W ten sam sposób można powiedzieć, że wartości w czwartym kwartylu rosną od 5,6 USD w górę
Odpowiedź
Uwaga: W poniższej odpowiedzi zakładam, że znasz tylko kwantyle, o których wspomniałeś i nie wiesz nic więcej o dystrybucji, na przykład nie wiesz, czy rozkład jest symetryczny lub jaki jest jego pdf lub jego (scentralizowane) momenty są.
Nie można obliczyć czwartego kwartylu, jeśli masz tylko medianę i IQR.
Spójrzmy na następujące definicje:
mediana = drugi kwartyl.
IQR = trzeci kwartyl $ – $ pierwszy kwartyl.
Czwarty kwartyl nie występuje w żadnym z tych dwóch równań. Dlatego nie można go obliczyć na podstawie podanych informacji.
Oto jeden przykład:
x <- c(1,2,3,4,5,6,7,8,9,10) y <- c(1,2,3,4,5,6,7,8,9,20) summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 5.50 7.75 10.00 summary(y) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 6.50 7.75 20.00
Pierwszy kwartyl dotyczy zarówno „x”, jak i „y” 3,25. W obu przypadkach mediana wynosi 5,5. Trzeci kwartyl to 7,75 dla obu, a IQR wynosi 7,75 $ – 3,25 $ = 4,5 dla obu. Jednak czwarty kwartyl, który jest jednocześnie maksimum, jest inny, a mianowicie 10 i 20.
Możesz również spojrzeć na wykresy pudełkowe x i y, a zobaczysz, że pierwszy kwartyl, drugi kwartyl (mediana) i trzeci kwartyl są równe. W związku z tym nie można nic wyciągnąć na temat pozostałej części dystrybucji punktów danych.
df <- data.frame(x,y) p <- ggplot(stack(df), aes(x = ind, y = values)) + geom_boxplot() p
Komentarze
- Wyjątkiem byłoby, gdyby dystrybucja była znana z być symetryczne. W takim przypadku kwartyle to IQR / 2 po obu stronach mediany.
- Słuszna uwaga. Zawarłem to w mojej odpowiedzi.
- W porządku !! Teraz rozumiem !! W rzeczywistości byłem zdezorientowany.
- Nie krępuj się przyjąć jedną z odpowiedzi.
Odpowiedź
@Ferdi ma rację, ale myślę, że zadajesz złe pytanie. Myślę, że jesteś zdezorientowany, ponieważ „kwartyl” wydaje się oznaczać „4 coś”. Są rzeczywiście 4 grupy. Ale to oznacza, że istnieją 3 działy i, przynajmniej w tym, co przeczytałem, w ogóle nie jest używany termin czwarty kwartyl (jako liczba). Jeśli obliczysz czwarty kwartyl jako liczbę, to również chcesz kwartyl zerowy, który byłby minimum. Ale nie sądzę, że tego chcesz.
Jeśli to nie jest jasne, wyobraź sobie cięcie prostokąta na 4 prostokąty. Potrzebujesz trzech cięć, aby utworzyć cztery prostokąty.
Jeśli niesłusznie oskarżyłem cię o zagubienie, przepraszam, ale widziałem to zamieszanie więcej niż raz.
Komentarze
- To ' ma rację, na pewno jestem zdezorientowany
Odpowiedź
Pierwszy kwartyl zawiera 25% danych poniżej, drugi kwartyl = mediana zawiera 50% danych poniżej, trzeci kwartyl ma 75% danych poniżej i 25% powyżej. IQR = 3. kwartyl – 1. kwartyl. Czwarty kwartyl to maksimum, którego nie można uzyskać z mediany i IQR. IQR i mediana mówią bardzo niewiele o kształcie rozkładu. Możesz być w stanie dokonać oszacowania, jeśli znasz kształt rozkładu , ale w przypadku wielu dystrybucji odpowiedzią będzie nieskończoność. Podejrzewam, że trzeci kwartyl jest tym, czego naprawdę potrzebujesz.Jeśli masz IQR i medianę i znasz kształt rozkładu , możesz oszacować trzeci kwartyl: np. mediana plus połowa IQR dla symetrycznego rozkładu. Jednak wiele dystrybucji nie jest symetrycznych. Zachowaj również ostrożność, jeśli zamiast IQR podano ci półkwartyl rozstępu.