Wie berechnet man das 4. Quartil aus Median und IQR?

Wie kann ich das 4. Quartil aus Median und IQR berechnen? In einem wissenschaftlichen Artikel habe ich folgende Werte:

  • Der Median beträgt 2,8 ng / ml Bisphenol A und
  • Im Interquartilbereich haben sie 1,5-5,6 geschrieben.

Kann ich daraus schließen, dass

  • das erste Quartil 1,5
  • das zweite Quartil 2,8
  • und das dritte ist Quartil 5.6?

Wenn es in Ordnung ist, verstehe ich, aber ich muss neu berechnen, um vier Quartile zu haben. Können Sie mir helfen?

Kommentare

  • siehe Ferdis ' Antwort, aber sind Sie sicher, dass Sie das 4. Quartil als meinen? eine Zahl? Dies wäre im Wesentlichen der Maximalwert.
  • Können Sie klarstellen, was Sie mit dem vierten Quartil meinen? Normalerweise gibt es nur $ q – 1 $ verschiedene $ q $ -Quantile (drei Quartile, vier Quintile, neun Dezile usw.), es sei denn, Sie ' beziehen sich auf die Intervalle, die die Quartile trennen. (Wenn Sie den größten Wert als viertes Quartil zählen, zählen Sie ' auch die kleinste Beobachtung als nullten und dort ' d sei dann $ q + 1 $, nicht $ 1 $.) Siehe den zweiten Satz des zweiten Absatzes hier und dieser Artikel .
  • Die Werte im dritten Quartil als eine Reihe von Zahlen (anstelle eines Punktes) liegen möglicherweise zwischen 2,8 und 5,6 US-Dollar. Auf die gleiche Weise kann man sagen, dass die Werte im vierten Quartil von $ 5,6 $ aufwärts gehen.

Antwort

Hinweis: In der folgenden Antwort gehe ich davon aus, dass Sie nur die von Ihnen erwähnten Quantile kennen und nichts anderes über die Verteilung wissen. Beispielsweise wissen Sie nicht, ob die Verteilung symmetrisch ist oder welche PDF- oder (zentralisierten) Momente sie aufweist sind.


Es ist nicht möglich, das 4. Quartil zu berechnen, wenn Sie nur den Median und den IQR haben.

Sehen wir uns die folgenden Definitionen an:

median = zweites Quartil.

IQR = drittes Quartil $ – $ erstes Quartil.

Das 4. Quartil befindet sich in keiner dieser beiden Gleichungen. Daher ist es unmöglich, es mit den angegebenen Informationen zu berechnen.


Hier ist ein Beispiel:

 x <- c(1,2,3,4,5,6,7,8,9,10) y <- c(1,2,3,4,5,6,7,8,9,20) summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 5.50 7.75 10.00 summary(y) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 6.50 7.75 20.00 

Das erste Quartil ist sowohl für „x“ als auch für „y“ 3,25. Auch der Median beträgt für beide 5,5. Das dritte Quartil beträgt für beide 7,75 und der IQR für beide 7,75 $ – 3,25 $ = 4,5. Das 4. Quartil, das auch das Maximum ist, ist jedoch unterschiedlich, nämlich 10 und 20.


Sie können sich auch Boxplots von x und y ansehen und sehen, dass das erste Quartil, das Das zweite Quartil (Median) und das dritte Quartil sind gleich. Daher können Sie nichts über den Rest der Verteilung der Datenpunkte schließen.

df <- data.frame(x,y) p <- ggplot(stack(df), aes(x = ind, y = values)) + geom_boxplot() p 

hier Bildbeschreibung eingeben

Kommentare

  • Eine Ausnahme wäre, wenn die Verteilung bekannt ist symmetrisch sein. In diesem Fall sind die Quartile IQR / 2 auf beiden Seiten des Medians.
  • Guter Punkt. Ich habe es in meine Antwort aufgenommen.
  • Alles klar !! Ich verstehe jetzt !! Ich war tatsächlich verwirrt.
  • Sie können gerne eine der Antworten akzeptieren.

Antwort

@Ferdi ist richtig, aber ich denke, dass Sie die falsche Frage stellen. Ich denke, Sie sind verwirrt, weil „Quartil“ „4 von etwas“ zu bedeuten scheint. Es gibt tatsächlich 4 Gruppen. Das heißt aber, es gibt 3 Unterteilungen, und zumindest in dem, was ich gelesen habe, wird der Begriff 4. Quartil (als Zahl) überhaupt nicht verwendet. Wenn Sie das 4. Quartil als Zahl berechnen, dann möchten Sie auch das 0. Quartil, das das Minimum wäre. Aber ich glaube nicht, dass du das willst.

Falls dies nicht klar ist, schneiden Sie ein Bild aus einem Rechteck in 4 Rechtecke. Sie benötigen drei Schnitte, um vier Rechtecke zu erstellen.

Wenn ich Sie fälschlicherweise beschuldigt habe, verwirrt zu sein, habe ich entschuldige dich, aber ich habe diese Verwirrung mehr als einmal gesehen.

Kommentare

  • Das ' ist richtig, ich bin sicherlich verwirrt

Antwort

Das erste Quartil enthält 25% der Daten, das zweite Quartil = Median 50% der Daten darunter, das dritte Quartil hat 75% Daten unten und 25% oben. IQR = 3. Quartil – 1. Quartil. Ein viertes Quartil wäre das Maximum, das Sie nicht aus dem Median und dem IQR erhalten können. IQR und Median sagen nur sehr wenig über die Form der Verteilung aus. Sie können möglicherweise eine Schätzung vornehmen, wenn Sie die Form der Verteilung kennen , aber für viele Distributionen wird die Antwort unendlich sein. Ich vermute, dass das dritte Quartil das ist, was Sie wirklich wollen.Wenn Sie den IQR und den Median haben und die Form der Verteilung kennen, können Sie möglicherweise das dritte Quartil schätzen: z. Median plus die Hälfte des IQR für eine symmetrische Verteilung. Viele Verteilungen sind jedoch nicht symmetrisch. Seien Sie auch vorsichtig, wenn Sie den Semi-Interquartil-Bereich anstelle des IQR erhalten haben.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.