부트 스트랩의 단점 (위키에서)

부트 스트랩의 단점에 대한 위키피디아에서는 다음과 같이 말합니다.

명백한 단순성은 부트 스트랩 분석 (예 : 샘플의 독립성)을 수행 할 때 중요한 가정이 이루어지고 있다는 사실을 숨길 수 있습니다. 여기서 이러한 가정은 다른 접근 방식에서보다 공식적으로 언급됩니다.

이 문장을 설명해 주시겠습니까?

댓글

답변

  1. It “s wiki, 모든 wiki를 염두에두고 읽으십시오. 불명확하거나 의견 기반이거나 인용이 필요한 것으로 플래그를 올려야합니다. 모두 (부분적으로) 사실입니다. 공식적인 증거없이 광범위한 진술을 할 수 있다고 생각하는 통계에 최근 유입 된 사람들이 지배 할 필요가 있습니다 (저는 그 진술에 저를 포함합니다).

  2. 부트 스트랩 샘플이 독립적 일 필요는 없습니다 . 무조건 부트 스트랩보다 더 효율적인 특수 부트 스트랩 절차가 있습니다.

  3. 이 기사는 부트 스트랩 복제를 생성하는 절차를 병합하는 중요한 오류를 만듭니다. 데이터 세트 (가정이 없음 ) 및 테스트 통계에 대한 부트 스트랩 간격 / p- 값을 얻습니다. BCa, Quantile, Normal Percentile 및 Double Bootstrap 방법은 기존에있는 것의 하위 집합 일 뿐이며 모두 이미 부트 스트랩 된 연구 데이터 복제에서 수행되도록 개발되었습니다. 기본적으로 CI를 얻는 방법은 하나도 없습니다. 데이터 자체의 속성 이라기보다는 선택된 통계의 함수가되는 것입니다.

댓글

  • 부트 스트랩은 샘플이 독립적 일 필요가 없습니다. 더 유용한 답변을 위해 확장해야한다고 생각합니다. 예를 들어 클러스터 부트 스트랩은 ' 개별 관찰 이 독립적 일 필요는 없지만 클러스터가 있어야합니다. 시계열에 대한 블록 부트 스트랩이 더 흥미로운 경우이지만 저는 ' 어떻게 '가 점근 적으로 정당화되었는지 잘 모르겠습니다 (말하지 않고 ' 그렇게 말하면 ') . 최소한 " vanilla " 부트 스트랩은 대부분의 사람들이 독립이 필요하다고 생각합니다.
  • @CliffAB 저는 이것이 효율성을위한 고려 사항이라고 주장하지만, 반드시 추론을위한 것은 아닙니다. 상관 관계가있는 샘플에서 무조건 부트 스트랩을 사용하고 각 하위 샘플의 GLS 매개 변수를 추정하는 경우, 추정치는 클러스터 크기의 추가 된 가변성으로 인해 더 광범위하게 변하지 만 다른 영향은 없습니다. 차단 된 부트 스트랩은 효율성을 향상시킵니다.
  • ' 당신의 의견을 이해하지 못합니다. ' 무시한 경우 클러스터 내 상관 관계와 블록 대신 개별 단위를 샘플링하면 표준 오류의 부트 스트랩 추정치 (예 :)는 큰 편향을 가지며 일관된 추정자가 아닙니다. 따라서 추론은 유효하지 않습니다.
  • @CliffAB는 클러스터 간 또는 클러스터 내 분산을 추정하기 위해 가중치 부트 스트랩을 사용하는 경우 가중치 샘플을 수행하는 것과 동일한 매력적인 특성을 가지고 있습니다. 그러나 나는 당신이 잘못된 분산 추정기를 사용하고 있다고 말할 것입니다. GLS 분산 추정기는 부트 스트랩 된 샘플에서 사용해야합니다.
  • 이제 ' 더 혼란 스럽습니다. 부트 스트랩을 사용하는 대신 GLS 분산 추정기를 사용하는 이유는 무엇입니까? 표준 오차의 추정? 참고로 저는 ' 클러스터 부트 스트랩을 사용하여 상관 된 샘플을 처리하는 것을 말합니다. 즉, en.wikipedia.org/wiki/ …

답변

부트 스트랩이 다른 일반적인 예를 대체하는 데 사용할 수있는 “가정없는”절차로 대략적으로 제시 될 수 있다는 사실과 관련이 있습니다. 필요한 가정 (예 : 정규성)이 충족되지 않을 때 테스트합니다. 그러나 부트 스트랩은 또한 충족되어야하는 가정을 제기하는 특정 상황에서만 관련이 있습니다.

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다