내 질문을 맥락에 맞추기 위해 물리학 자이지만 통계에 대한 노출이 제한적이며 이에 대해 배운 내용은 30 개가 넘었습니다. 여러 해 전에.
블록 부트 스트래핑에 대해 배우려고합니다. 그 기술이 제가 작업중인 문제를 해결하는 데 적합 할 수 있기 때문입니다. 블록 부트 스트래핑의 수학에 대한 많은 논문 / 책 / 정보를 찾을 수 있지만 블록 부트 스트랩 이동, 원형 블록 부트 스트랩, 고정 블록 부트 스트랩과 같은 문제를 “모험”하기 전에 블록 부트 스트랩 프로세스에 대한 일반적인 설명을 먼저 찾고 싶습니다. , blocklengths, samplesize 등.
상관 된 데이터, 5 개의 변수 (열)를 10000 개의 관측치 (행)로 오버 샘플링하여 약 100 행의 데이터로 줄이려고합니다. 데이터는 시계열이지만 연속적이지 않으며 다른 위치의 데이터도있을 수 있습니다. 즉, 동시에 다른 데이터를 가질 수 있습니다 (후자가 블록 부트 스트랩에 문제가되는 경우 “중복 된”데이터를 제거 할 수 있음) 제 시간에). 블록 부트 스트래핑을 사용하면 데이터의 상관 관계를 복제 할 수 있습니다.
최종 목표는 전체 데이터 세트의 pdf 및 cdf와 축소 된 데이터 세트가 동일하도록 데이터 세트를 ~ 100 행의 데이터로 줄이는 것입니다. (아직 정의되지 않은 최소 오류 범위 내) 5 개 변수 모두에 대해.
질문 : 1) 블록 부트 스트랩이이를 수행 할 수 있습니까? 2) 이것이 수행되는 단계별 프로세스는 무엇입니까? 누구도 여기에 전체 과정을 자세하게 작성하길 기대하지는 않지만, 누군가 내가 시작할 수있는 유튜브 비디오 나 “인형을위한 부트 스트랩”을 넣었을 수도 있습니다.
나는 비슷한 것을 보았습니다. 여기에 블록 부트 스트랩에 대한 질문이 있고 “시계열 분석에서 블록 부트 스트랩에 대해 배울 수있는 리소스”에 대한 질문이 있지만 답변의 참조는 내가 여전히 마스터해야하는 통계적 능력을 가정합니다.
댓글
- 이 소개 는 어떻습니까? 부트 스트랩과 블록 부트 스트랩에 대한 소개가 있습니다.
Answer
모델없는 시계열 리샘플링은 블록 부트 스트랩이라고도하는 블록 리샘플링을 통해 수행되며 다음을 사용하여 구현할 수 있습니다. R의 부트 패키지에있는 tsboot 함수입니다. 아이디어는 시리즈를 대략 동일한 길이의 연속 관측 블록으로 나누고, 블록을 대체로 다시 샘플링 한 다음 블록을 붙여 넣어 그녀. 예를 들어 시계열의 길이가 200이고 하나가 길이가 20 인 10 개의 블록을 사용하는 경우 블록은 처음 20 개의 관측치, 다음 20 개의 관측치 등입니다. 가능한 리샘플링은 네 번째 블록 (관찰 61 ~ 80), 마지막 블록 (관찰 181 ~ 200), 두 번째 블록 (관찰 21 ~ 40), 다시 네 번째 블록, 10 개 블록이 될 때까지 계속됩니다. 리 샘플에서. 시계열 데이터로 부트 스트랩하는 방법
댓글
- economia는 boostrapping에 대해 설명했지만 부트 스트랩 된 샘플은 데이터 세트를 동일한 기본 분포를 가진 더 작은 데이터 세트로 줄이는 데 사용되지 않습니다. (당신이 당신의 목표라고 말한). 부트 스트랩 핑은 부트 스트랩 된 샘플을 생성 한 다음 부트 스트랩 된 샘플의 경험적 분포와 관련하여 통계 (테스트중인 항목)가 떨어지는 위치를 확인하여 일부 가설을 테스트하는 데 사용됩니다. 따라서 데이터 세트를 더 작은 데이터 세트로 줄이는 것은 bstrapping의 목표가 아닙니다. ' 모델이없는 방식으로 가설 테스트에 사용됩니다.