대체로 원래 관측치 로부터 각각 크기 의 샘플을 추출 하여 소위 비모수 적 부트 스트랩을 수행한다고 가정합니다 . 이 절차는 경험적인 cdf에 의한 누적 분포 함수를 추정하는 것과 같습니다.
http://en.wikipedia.org/wiki/Empirical_distribution_function
그리고 추정 된 cdf 시간 으로부터 관측치를 연속 으로 시뮬레이션함으로써 부트 스트랩 샘플을 획득하는 단계 를 포함한다.
내가 이것에 옳다면 경험적 cdf에 약 N 개의 매개 변수가 있기 때문에 과적 합 문제를 해결해야합니다. 물론 무증상으로 모집단 cdf에 수렴하지만 유한 샘플은 어떻습니까? 예를 들어 100 개의 관측치가 있고 cdf 를 두 개의 매개 변수를 사용하여 로 추정 할 경우 경보가 발생하지 않습니다. 그러나 매개 변수의 수가 100 개까지 올라가면 전혀 합리적이지 않습니다.
하나는 표준 다중 선형 회귀를 이용하는 경우도 마찬가지로, 오차항의 분포는 다음과 같이 추정되는 . 만약 잔차를 부트 스트랩으로 전환하기로 결정했다면, 이제는 에러 항 분포를 처리하기 위해 사용 된 약 n 개의 매개 변수 가 있다는 것을 알아야합니다 .
이 문제를 명시 적으로 해결하는 출처로 안내해 주시거나 제가 잘못 생각한 경우 왜 문제가되지 않는지 말씀해주십시오.