中央値とIQRから4番目の四分位数を計算する方法は?

中央値とIQRから4番目の四分位数を計算するにはどうすればよいですか。科学的な記事では、次の値があります。

  • 中央値は2.8ng / mlのビスフェノールAであり、
  • 四分位範囲は1.5〜5.6と書かれています。

結論を出すことができますか

  • 最初の四分位数は1.5です
  • 2番目の四分位数は2.8
  • 四分位数5.6?

問題がなければ理解できますが、四分位数を4つにするために再計算する必要があります。手伝って頂けますか?

コメント

  • Ferdi 'の回答を参照してください。ただし、4番目の四分位数を意味しますか?数?基本的には最大値になります。
  • 第4四分位数の意味を明確にできますか? '四分位数が分離する間隔を参照しない限り、通常は$ q − 1 $の異なる$ q $分位数(3つの四分位数、4つの四分位数、9つの十分位数など)しかありません。 (最大値を4番目の四分位数として数える場合、' dも最小の観測値を0番目として数え、そこに' dは$ 1 $ではなく$ q + 1 $になります。)2番目の段落の2番目の文こここの記事
  • (ポイントではなく)数値のセットとしての第3四分位数の値は、2.8ドルから5.6ドルの間であると言えます。したがって、同じように、第4四分位の値は$ 5.6 $から上に行くと言われるかもしれません

回答

注:次の回答では、あなたが言及した四分位数のみを知っており、分布について他に何も知らないと仮定します。たとえば、分布が対称であるかどうか、またはそのpdfまたはその(中央値)モーメントが何であるかを知りません。


中央値とIQRしかない場合、第4四分位数を計算することはできません。

次の定義を見てみましょう。

中央値= 2番目の四分位数。

IQR = 3番目の四分位数$-$最初の四分位数。

4番目の四分位数は、これら2つの方程式のどちらにも含まれていません。したがって、与えられた情報でそれを計算することは不可能です。


ここに1つの例があります:

 x <- c(1,2,3,4,5,6,7,8,9,10) y <- c(1,2,3,4,5,6,7,8,9,20) summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 5.50 7.75 10.00 summary(y) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 6.50 7.75 20.00 

最初の四分位数「x」と「y」の両方に対応します3,25。また、中央値は両方とも5.5です。 3番目の四分位数は両方で7.75であり、IQRは両方で7.75 $-$ 3.25 = 4.5です。ただし、最大値でもある4番目の四分位数は異なります。つまり10と20です。


xとyの箱ひげ図を見ると、最初の四分位数である2番目の四分位数(中央値)と3番目の四分位数は等しい。したがって、データポイントの残りの分布について結論を出すことはできません。

df <- data.frame(x,y) p <- ggplot(stack(df), aes(x = ind, y = values)) + geom_boxplot() p 

ここに画像の説明を入力してください

コメント

  • 例外は、ディストリビューションが対称的であること。その場合、四分位数は中央値の両側のIQR / 2です。
  • 良い点です。私はそれを私の答えに含めました。
  • 大丈夫です!!今、私は分かる !!実際に混乱しています
  • 回答の1つを自由に受け入れてください。

回答

@Ferdiは正しいですが、あなたは間違った質問をしていると思います。 「四分位」は「何かの4」を意味しているように見えるので、あなたは混乱していると思います。確かに、4つのグループがあります。しかし、それは3つの区分があり、少なくとも私が読んだところでは、第4四分位数(数値として)という用語はまったく使用されていないことを意味します。第4四分位数を数値として計算する場合は、最小値となる0番目の四分位数。しかし、私はそれがあなたが望むものだとは思いません。

はっきりしない場合は、長方形を4つの長方形にカットする画像。4つの長方形を作成するには3つのカットが必要です。

混乱していると誤って非難した場合は、申し訳ありませんが、私はこの混乱を何度も見ました。

コメント

  • その通り'そうです、私は確かに混乱しています

回答

最初の四分位数はその下のデータの25%、2番目の四分位数=中央値はその下のデータの50%、3番目の四分位数下に75%、上に25%のデータがあります。 IQR = 3番目の四分位数-1番目の四分位数。 4番目の四分位数は最大値であり、中央値とIQRからは取得できません。IQRと中央値は分布の形についてほとんど教えてくれません。分布の形を知っていれば推定できるかもしれません。 、ただし、多くのディストリビューションでは、答えは無限大になります。第3四分位数が本当に必要なものだと思います。IQRと中央値があり、分布の形がわかっている場合、第3四分位数を推定できる場合があります。 対称分布の中央値とIQRの半分。 ただし、多くの分布は対称的ではありません。 また、IQRではなく半四分位範囲が与えられている場合は注意してください。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です