우선 : 내가 이해 한 바에 따르면 부트 스트랩 잔차는 다음과 같이 작동합니다.
- 모델을 데이터에 적합
- 잔차 계산
- 잔차를 다시 샘플링하여 1에 더합니다.
- 모델을 3의 새 데이터 세트에 맞 춥니 다.
- 반복
n
횟수는 있지만 항상 재 표본 된 잔차를 1의 적합치에 추가하십시오.
지금까지는 맞습니까?
내가하고 싶은 것은 약간 다른 것입니다.
일부 환경 변수를 추정하는 알고리즘의 매개 변수 및 예측 불확실성을 추정하고 싶습니다.
내가 가진 것은 합성 데이터 세트를 생성하기 위해 x_true
노이즈를 추가 하는 변수의 오류없는 시계열 (시뮬레이션에서)입니다 . 그런 다음 알고리즘을 목적 함수로 제곱합 (! not !)으로 피팅하여 최적의 매개 변수를 찾습니다 . 내 알고리즘의 성능을 확인하고 매개 변수 분포 샘플을 작성하기 위해 리샘플링 하고에 추가하고 모델을 다시 맞추고 헹구고 반복하고 싶습니다. 이것이 매개 변수 불확실성을 평가하기위한 올바른 접근법입니까? 부트 스트랩 된 데이터 세트에 대한 적합치를 예측 불확실성으로 해석 할 수 있습니까, 아니면 위에 게시 한 절차를 따라야합니까?x_noise
x
sum((x_estimate - x_true)^2)
x_estimate - x
x_noise
x_true
/ 편집 : 내 모델이 실제로 무엇인지 명확하게 밝히지 않았다고 생각합니다. 본질적으로 노이즈 제거 방법과 같은 것으로 생각하십시오. 예측 모델이 아니며 시끄러운 시계열 환경 데이터의 기본 신호를 추출하려고하는 알고리즘입니다.
/ edit ^ 2 : MATLAB-Users를 위해, 나는 의미하는 것의 빠르고 더러운 선형 회귀 예제를 작성했습니다.
이것이 내가 잔존물을 "보통"부트 스트랩한다고 믿는 것입니다 (잘못되면 정정하십시오) : http://pastebin.com/C0CJp3d1
이것이 내가하고 싶은 일입니다 : http://pastebin.com/mbapsz4c