'통계 학습의 요소'에서 선형 모형의 바이어스-분산 분해에 대한 표현은 여기서 은 실제 대상 함수이고 는 모델의 임의 오차의 분산입니다. 및 의 선형 추정기 인 .
이 방정식은 대상에 노이즈가없는 경우 즉, 경우 분산이 0이된다는 것을 암시하기 때문에 여기서 문제가됩니다그러나 제로 노이즈로도 분산이 0이 아닌 다른 트레이닝 세트에 대해 다른 추정기 를 얻을 수 있기 때문에 의미가 없습니다 .
예를 들어, 목표 함수 가 2 훈련 데이터에이 2 차에서 무작위로 샘플링 된 2 개의 점이 포함되어 있다고 가정합니다 . 분명히, 나는 2 차 목표에서 무작위로 두 점을 샘플링 할 때마다 다른 선형 피팅을 얻을 것입니다. 그렇다면 어떻게 분산이 0이 될 수 있습니까?
바이어스 편차 분해에 대한 이해에서 무엇이 잘못되었는지 알아낼 수있는 사람이 있습니까?