장난감 예제를 사용하여 바이어스-분산 트레이드 오프 설명
@Matthew Drury가 지적했듯이 현실적인 상황에서는 마지막 그래프를 볼 수 없지만 다음 장난감 예제는 도움이되는 사람들에게 시각적 해석과 직관을 제공 할 수 있습니다.
데이터 세트 및 가정
와이
- 와이= s i n ( πx − 0.5 ) + ϵϵ ∼ Un 나는 fo r m ( − 0.5 , 0.5 )
- 와이= f( x ) + ϵ
엑스와이Va r ( Y) = Va r ( ϵ ) = 112
에프^( x ) = β0+ β1x + β1엑스2+ . . . + β피엑스피
다양한 다항식 모델 피팅
직관적으로, 데이터 세트가 비선형이기 때문에 직선 곡선이 제대로 작동하지 않을 것으로 예상됩니다. 마찬가지로, 매우 다항식을 피팅하는 것은 과도 할 수 있습니다. 이 직감은 아래의 그래프에 반영되어 있으며 열차 및 테스트 데이터에 대한 다양한 모델과 해당 평균 제곱 오류를 보여줍니다.
위의 그래프 는 단일 열차 / 시험 분할에 적용됩니다. 되지만 일반화 여부는 어떻게 알 수 있습니까?
예상 열차 추정 및 MSE 테스트
여기에는 많은 옵션이 있지만 한 가지 방법은 기차 / 테스트간에 데이터를 무작위로 나누는 것입니다. 주어진 분할에 모델을 맞추고이 실험을 여러 번 반복하십시오. 결과 MSE를 플로팅 할 수 있으며 평균은 예상 오차의 추정치입니다.
테스트 MSE가 데이터의 다른 기차 / 테스트 스플릿에 대해 크게 변동하는 것을 보는 것은 흥미 롭습니다. 그러나 충분히 많은 수의 실험에서 평균을 취하면 더 나은 자신감을 얻을 수 있습니다.
와이 이 값보다 결코
바이어스-분산 분해
여기 에 설명 된 대로 MSE는 3 가지 주요 구성 요소로 나눌 수 있습니다.
이자형[ ( Y− f^)2] = σ2ϵ+ B i a s2[ f^] + Va r [ f^]
이자형[ ( Y− f^)2] = σ2ϵ+ [ f− E[ f^] ]2+ E[ f^− E[ f^] ]2
우리 장난감의 경우 :
- 에프 초기 데이터 세트에서 알려짐
- σ2ϵ 균일 분포에서 알려져 ϵ
- 이자형[ f^] 위와 같이 계산할 수 있습니다
- 에프^ 밝은 색상의 선에 해당
- 이자형[ f^− E[ f^] ]2 평균을 취하여 추정 할 수 있습니다
다음 관계를주는
참고 : 위의 그래프는 학습 데이터를 사용하여 모델에 적합한 다음 train + test에서 MSE를 계산합니다 .