"샘플 내"및 "의사 샘플 외부"예측의 차이점


답변:


18

당신은 데이터가 있다고 가정 , H { 1 , 2 , ... } , 당신의 목표는 모델을 구축하는 것입니다 (예를 들어, F ( X t - 시간 ) ) 예측하는 Y의 t 주어진 X의 t - 시간을 . 구체적으로 데이터가 매일이고 T 가 오늘에 해당 한다고 가정합니다 .{Yt,Xth}t=h+1Th{1,2,},f^(Xth)YtXthT

표본 내 분석은 최대 포함하여 사용 가능한 모든 데이터를 사용하여 모형을 추정 한 다음 모형의 적합치를 실제 실현과 비교하는 것입니다. 그러나이 절차는 일반적인 피팅 알고리즘 (예 : 제곱 오차 또는 가능성 기준 사용)이 큰 예측 오차를 피하기 위해 어려움을 겪는 경향이 있기 때문에 모델의 예측 능력에 대해 지나치게 낙관적 인 그림을 그리는 것으로 알려져 있습니다. 데이터 신호.T

YT+1eT+1YT+1f^(XT+1h),YT+2{eT+l}l=1L

T0<TT{et}t=T0+1T

표본의 표본 추출 분석이 모형의 표본 추출 성능을 추정하는 유일한 방법은 아닙니다. 대안으로는 교차 검증 및 정보 기준이 있습니다.

이 모든 문제에 대한 아주 좋은 논의는 7 장에서 제공됩니다.

http://www.stanford.edu/~hastie/local.ftp/Springer/OLD/ESLII_print4.pdf


3
PDF 링크는 작동하지 않지만 Tibshirani의 무료 온라인 서적 "통계 학습의 요소 : 데이터 마이닝, 추론 및 예측"
Oleg Melnikov
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.