중앙값과 IQR에서 4 사 분위수를 계산하는 방법은 무엇입니까?

중앙값과 IQR에서 4 사 분위수를 계산하려면 어떻게해야합니까? 과학 기사에서 나는 그 값을 가지고 있습니다.

  • 중앙값은 비스페놀 A의 2.8 ng / ml이고
  • 사 분위수 범위는 1.5-5.6입니다.
  • 첫 번째 사 분위수는 1.5
  • 두 번째 사 분위수 2.8
  • 그리고 세 번째 사 분위수는 사 분위수 5.6?

괜찮다면 이해하지만 사 분위수 4 개를 갖기 위해서는 다시 계산해야합니다. 도와주세요?

댓글

  • Ferdi '의 답변을 참조하세요. 그러나 4 분위를 다음과 같이 의미한다고 확신하십니까? 숫자? 본질적으로 최대 값입니다.
  • 4 사 분위가 의미하는 바를 명확히 할 수 있습니까? 사 분위수가 분리되는 구간을 참조하지 않는 한, 일반적으로 $ q − 1 $ 다른 $ q $ -quantile (3 사 분위, 4 분위, 9 분위 등) 만 있습니다. ' (가장 큰 값을 4 사 분위수로 세는 경우 ' d는 또한 가장 작은 관측치도 0 분위수로 계산하고 ' d는 $ 1 $가 아니라 $ q + 1 $입니다.) 두 번째 단락의 두 번째 문장은 여기 이 도움말 .
  • 숫자 집합 (점이 아닌)으로 나타낸 3 사 분위의 값은 $ 2.8 $에서 $ 5.6 $ 사이라고 할 수 있습니다. 따라서 같은 방식으로 4 사 분위의 값은 $ 5.6 $에서 위로 올라간다고 말할 수 있습니다.

Answer

참고 : 다음 답변에서 나는 당신이 언급 한 분위수 만 알고 있고 분포에 대해 아무것도 모른다고 가정합니다. 예를 들어 분포가 대칭인지 또는 pdf 또는 (중앙 집중식) 모멘트가 무엇인지 알 수 없습니다.


중앙값과 IQR 만 있으면 4 사 분위수를 계산할 수 없습니다.

다음 정의를 살펴 보겠습니다.

중앙값 = 2 분위.

IQR = 3 사 분위 $-$ 1 사 분위.

4 사 분위는이 두 방정식 중 어느 것도 포함하지 않습니다. 따라서 주어진 정보로는 계산할 수 없습니다.


다음은 한 가지 예입니다.

 x <- c(1,2,3,4,5,6,7,8,9,10) y <- c(1,2,3,4,5,6,7,8,9,20) summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 5.50 7.75 10.00 summary(y) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 3.25 5.50 6.50 7.75 20.00 

1 사 분위 “x”와 “y”모두 3,25입니다. 또한 중앙값은 둘 다 5.5입니다. 세 번째 사 분위수는 둘 다 7.75이고 IQR은 둘 다 7.75 $-$ 3.25 = 4.5입니다. 그러나 최대 값이기도 한 4 사 분위수는 다릅니다. 즉, 10과 20입니다.


x와 y의 상자 그림도 볼 수 있으며 첫 번째 사 분위수 인 2 사 분위수 (중앙값)와 3 사 분위수는 동일합니다. 따라서 데이터 포인트의 나머지 분포에 대해서는 결론을 내릴 수 없습니다.

df <- data.frame(x,y) p <- ggplot(stack(df), aes(x = ind, y = values)) + geom_boxplot() p 

여기에 이미지 설명 입력

댓글

  • 배포가 알려진 경우 예외입니다. 대칭이어야합니다. 이 경우 사 분위수는 중앙값의 양쪽에서 IQR / 2입니다.
  • 좋은 지적입니다. 내 대답에 포함 시켰습니다.
  • 좋아요 !! 지금은 이해 !! 실제로 혼란 스러웠습니다.
  • 답변 중 하나를 자유롭게 수락하십시오.

답변

@Ferdi가 맞지만 잘못된 질문을하고있는 것 같습니다. “사 분위수”는 “무언가의 4″를 의미하기 때문에 혼란스러워하는 것 같습니다. 실제로 4 개의 그룹이 있습니다. 그러나 그것은 3 개의 나눗셈이 있다는 것을 의미하고, 적어도 내가 읽은 것에서는 4 사 분위수 (숫자로)라는 용어가 전혀 사용되지 않습니다. 4 사 분위수를 숫자로 계산한다면, 당신은 또한 원할 것입니다. 최소값 인 0 분위입니다. 그러나 나는 그것이 당신이 원하는 것이라고 생각하지 않습니다.

정확하지 않은 경우에는 직사각형을 4 개의 직사각형으로 자르십시오. 4 개의 직사각형을 만들려면 세 번의 절단이 필요합니다.

당신이 혼란 스럽다고 잘못 고발했다면, 저는 죄송하지만이 혼란을 두 번 이상 보았습니다.

댓글

  • ' 맞습니다. 확실히 혼란 스럽습니다.

답변

1 사 분위는 그 아래 데이터의 25 %, 2 사 분위 = 중앙값은 그 아래 데이터의 50 %, 3 분위 데이터가 75 % 아래에 있고 25 % 위에 있습니다. IQR = 3 사 분위-1 사 분위. 4 분위수는 최대 값이 될 것입니다. 중앙값과 IQR에서는 얻을 수 없습니다. IQR과 중앙값은 분포의 모양에 대해 거의 알려주지 않습니다. 분포의 모양을 알고 있으면 추정 할 수 있습니다. ,하지만 많은 분포의 경우 답은 무한대입니다. 3 사 분위수 가 실제로 원하는 것입니다.IQR과 중앙값 이 있고 분포의 형태를 알고 있다면 3 분위를 추정 할 수 있습니다. 예 : 대칭 분포에 대한 중앙값 더하기 IQR의 절반. 그러나 많은 분포가 대칭이 아닙니다. 또한 IQR이 아닌 반 사 분위수 범위가 주어진 경우에도주의하십시오.

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다