Hoe bereken je het 4e kwartiel op basis van mediaan en IQR?

Hoe kan ik het 4e kwartiel berekenen op basis van mediaan en IQR. In een wetenschappelijk artikel heb ik deze waarden:

  • De mediaan is 2,8 ng / ml bisfenol A en
  • Het interkwartielbereik, ze schreven dat 1,5-5,6.

Mag ik concluderen dat

  • het eerste kwartiel 1.5 is
  • het tweede kwartiel 2.8
  • en het derde kwartiel 5.6?

Als het goed is, begrijp ik het, maar ik moet het opnieuw berekenen om vier kwartielen te hebben. Kun je me helpen?

Reacties

  • zie het antwoord van Ferdi ', maar weet je zeker dat je het 4e kwartiel bedoelt als een getal? Het zou in wezen de maximale waarde zijn.
  • Kunt u verduidelijken wat u bedoelt met het vierde kwartiel? Er zijn normaal gesproken slechts $ q – 1 $ verschillende $ q $ -kwantielen (drie kwartielen, vier kwintielen, negen decielen enz.) Tenzij u ' verwijst naar de intervallen die de kwartielen scheiden. (Als je de grootste waarde meetelt als het vierde kwartiel, tel je ' ook de kleinste waarneming als de nul-de, en daar ' d is dan $ q + 1 $, niet $ 1 $.) Zie de tweede zin van de tweede alinea hier en dit artikel .
  • Waarden in het derde kwartiel als een reeks getallen (in plaats van een punt) zouden tussen $ 2,8 $ en $ 5,6 $ kunnen liggen. Op dezelfde manier zou men dus kunnen zeggen dat waarden in het vierde kwartiel van $ 5,6 $ naar boven gaan

Answer

Opmerking: in het volgende antwoord neem ik aan dat je alleen de kwantielen kent die je noemde en dat je verder niets weet over de distributie, je weet bijvoorbeeld niet of de distributie symmetrisch is of wat zijn pdf of zijn (gecentraliseerde) momenten zijn.


Het is niet mogelijk om het 4e kwartiel te berekenen als je alleen de mediaan en de IQR hebt.

Laten we eens kijken naar de volgende definities:

median = tweede kwartiel.

IQR = derde kwartiel $ – $ eerste kwartiel.

Het 4e kwartiel is in geen van deze twee vergelijkingen. Daarom is het onmogelijk om het te berekenen met de gegeven informatie.


Hier is een voorbeeld:

 x <- c(1,2,3,4,5,6,7,8,9,10) y <- c(1,2,3,4,5,6,7,8,9,20) summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 5.50 7.75 10.00 summary(y) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 6.50 7.75 20.00 

Het eerste kwartiel is voor zowel “x” als “y” 3,25. Ook de mediaan is 5,5 voor beide. Het derde kwartiel is 7,75 voor beide en de IQR is 7,75 $ – $ 3,25 = 4,5 voor beide. Het 4e kwartiel, dat ook het maximum is, is echter anders, namelijk 10 en 20.


Je kunt ook boxplots van x en y bekijken en je zult zien dat het eerste kwartiel, de tweede kwartiel (mediaan) en het derde kwartiel zijn gelijk. Daarom kun je niets concluderen over de rest van de distributie van de datapunten.

df <- data.frame(x,y) p <- ggplot(stack(df), aes(x = ind, y = values)) + geom_boxplot() p 

voer de beschrijving van de afbeelding hier in

Opmerkingen

  • Een uitzondering zou zijn als de distributie bekend is bij symmetrisch zijn. In dat geval zijn de kwartielen IQR / 2 aan weerszijden van de mediaan.
  • Goed punt. Ik heb het in mijn antwoord opgenomen.
  • Goed !! Ik begrijp het nu !! Ik ben eigenlijk in de war.
  • Voel je vrij om een van de antwoorden te accepteren.

Antwoord

@Ferdi heeft gelijk, maar ik denk dat je de verkeerde vraag stelt. Ik denk dat je in de war bent omdat “kwartiel” “4 van iets” lijkt te betekenen. Er zijn inderdaad 4 groepen. Maar dat betekent dat er 3 divisies zijn en, tenminste in wat ik heb gelezen, wordt de term 4e kwartiel (als getal) helemaal niet gebruikt. Als je het 4e kwartiel wel als getal berekent, dan wil je ook het 0e kwartiel, wat het minimum zou zijn. Maar ik denk niet dat je dat wilt.

Voor het geval dat niet duidelijk is, stel je voor dat je een rechthoek in 4 rechthoeken snijdt. Je hebt drie sneden nodig om vier rechthoeken te maken.

Als ik je ten onrechte heb beschuldigd van verwarring, Excuses, maar ik heb deze verwarring meer dan eens gezien.

Opmerkingen

  • Dat ' klopt, ik ben zeker in de war

Antwoord

Het eerste kwartiel bevat 25% van de gegevens eronder, het tweede kwartiel = mediaan heeft 50% van de gegevens eronder, het derde kwartiel heeft 75% gegevens hieronder en 25% erboven. IQR = 3e kwartiel – 1e kwartiel. Een vierde kwartiel zou het maximum zijn, wat je niet kunt halen uit de mediaan en IQR. IQR en mediaan vertellen je heel weinig over de vorm van de verdeling. Je kunt misschien een schatting maken als je de vorm van de verdeling kent , maar voor veel distributies zal het antwoord oneindig zijn. Ik vermoed dat het derde kwartiel is wat je echt wilt.Als je de IQR en mediaan hebt en de vorm van de verdeling kent, kun je misschien het derde kwartiel schatten: bijv. mediaan plus de helft van de IQR voor een symmetrische verdeling. Veel distributies zijn echter niet symmetrisch. Wees ook voorzichtig als u het semi-interkwartielbereik hebt gekregen in plaats van de IQR.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *