Jak vypočítat 4. kvartil z mediánu a IQR?

Jak mohu vypočítat 4. kvartil z mediánu a IQR. Ve vědeckém článku mám tyto hodnoty:

  • Medián je 2,8 ng / ml bisfenolu A a
  • mezikvartilní rozmezí, napsali 1,5-5,6.

Mohu dojít k závěru, že

  • první kvartil je 1,5
  • druhý kvartil 2,8
  • a třetí kvartil 5,6?

Pokud je to v pořádku, rozumím, ale musím přepočítat, abych měl čtyři kvartily. Můžeš mi pomoci?

Komentáře

  • viz odpověď Ferdiho ', ale jste si jisti, že máte na mysli čtvrtý kvartil jako číslo? V zásadě by to byla maximální hodnota.
  • Můžete objasnit, co máte na mysli ve čtvrtém kvartilu? Normálně existují pouze $ q – 1 $ různé $ q $ -kvantily (tři kvartily, čtyři kvintily, devět decilů atd.), Pokud ' neodkazujete na intervaly, které kvartily oddělují. (Pokud počítáte největší hodnotu jako čtvrtý kvartil, ' d také počítáte nejmenší pozorování jako nultou tu a tam ' d be $ q + 1 $ then, not $ 1 $.) Viz druhá věta druhého odstavce zde a tento článek .
  • Hodnoty ve třetím kvartilu jako množina čísel (spíše než bod) by se dalo říci mezi 2,8 $ až 5,6 $. Stejně tak lze říci, že hodnoty ve čtvrtém kvartilu se pohybují od 5,6 $ nahoru

Answer

Poznámka: V následující odpovědi předpokládám, že znáte pouze kvantily, které jste zmínili, a nevíte nic jiného o distribuci, například nevíte, zda je distribuce symetrická nebo jaké jsou její pdf nebo její (centralizované) momenty jsou.


Není možné vypočítat 4. kvartil, pokud máte pouze medián a IQR.

Podívejme se na následující definice:

median = druhý kvartil.

IQR = třetí kvartil $ – $ první kvartil.

4. kvartil není v žádné z těchto dvou rovnic. Proto je nemožné jej vypočítat s poskytnutými informacemi.


Zde je jeden příklad:

 x <- c(1,2,3,4,5,6,7,8,9,10) y <- c(1,2,3,4,5,6,7,8,9,20) summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 5.50 7.75 10.00 summary(y) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 6.50 7.75 20.00 

První kvartil je pro „x“ i „y“ 3,25. Medián je pro oba také 5,5. Třetí kvartil je pro oba 7,75 a IQR je 7,75 $ – 3,25 $ = 4,5 pro oba. Čtvrtý kvartil, který je také maximem, se však liší, konkrétně 10 a 20.


Můžete se také podívat na boxploty x a y a uvidíte, že první kvartil, druhý kvartil (medián) a třetí kvartil jsou stejné. O zbytku distribuce datových bodů proto nemůžete nic uzavřít.

df <- data.frame(x,y) p <- ggplot(stack(df), aes(x = ind, y = values)) + geom_boxplot() p 

sem zadejte popis obrázku

Komentáře

  • Výjimkou by byla situace, kdy je distribuce známa být symetrický. V takovém případě jsou kvartily IQR / 2 na obou stranách mediánu.
  • Dobrá věc. Zahrnul jsem to do své odpovědi.
  • Dobře !! Už chápu !! Vlastně jsem byl zmatený
  • Nebojte se přijmout jednu z odpovědí.

Odpověď

@ Ferdi má pravdu, ale myslím, že se ptáte špatně. Myslím, že jste zmatení, protože „kvartil“ znamená „4 něco“. Ve skutečnosti existují 4 skupiny. Ale to znamená, že existují 3 divize a alespoň v tom, co jsem četl, se termín 4. kvartil (jako číslo) vůbec nepoužívá. Pokud vypočítáte 4. kvartil jako číslo, pak také chcete 0. kvartil, což by bylo minimum. Ale já si nemyslím, že to je to, co chceš.

V případě, že to není jasné, obrázek rozřízne obdélník na 4 obdélníky. K vytvoření čtyř obdélníků potřebujete tři řezy.

Pokud jsem vás nesprávně obvinil ze zmatení, omlouvám se, ale tento zmatek jsem viděl více než jednou.

Komentáře

  • To má ' pravdu, jsem určitě zmatený

Odpověď

První kvartil má pod sebou 25% dat, druhý kvartil = medián má 50% dat pod sebou, třetí kvartil má 75% dat níže a 25% výše. IQR = 3. kvartil – 1. kvartil. Čtvrtý kvartil by byl maximum, které nemůžete získat z mediánu a IQR. IQR a medián vám říkají velmi málo o tvaru distribuce. Pokud znáte tvar distribuce, možná budete moci udělat odhad. , ale pro mnoho distribucí bude odpověď nekonečná. Mám podezření, že třetí kvartil je to, co opravdu chcete.Pokud máte IQR a medián a znáte tvar distribuce , můžete odhadnout třetí kvartil: např. medián plus polovina IQR pro symetrické rozdělení. Mnoho distribucí však není symetrických. Buďte také opatrní v případě, že jste dostali spíše mezikvartilní rozsah než IQR.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *