의 우리의 응답이 있다고 가정 해 봅시다 우리의 예측 값은 Y 1 , ... , Y n은 .와이1, … , y엔와이^1, … , y^엔
(사용 표본 분산 보다는 N - 1 편의상)입니다 1엔n - 1MSE가1 인동안 n ∑ n i = 1 (yi− ˉ y )21엔∑엔나는 = 1( y나는− y¯)2. 따라서 표본 분산은 평균 주위에서 반응이 얼마나 달라지는 지, MSE는 예측 주위에서 반응이 얼마나 달라지는지를 나타냅니다. 전체 평균 ˉ y 를우리가 생각한가장 간단한 예측 변수라고 생각하면 MSE를 반응의 표본 분산과 비교하여 모델에서 얼마나 많은 변동을 설명했는지 확인할 수 있습니다. 이것이 바로선형 회귀 분석에서R2값의 기능입니다.1엔∑엔나는 =1(y나는−y^나는)2와이¯아르 자형2
다음 그림을 고려하십시오. 의 표본 분산은 수평선 주위의 변동성입니다. 모든 데이터를 Y 축 에 투영하면 이것을 볼 수 있습니다. MSE 값은 회귀 직선의 평균 제곱 거리, 회귀 직선의 주위 즉 변동성 (즉, 인 y를 I ). 따라서 표본 분산으로 측정 된 변동성은 수평선에 대한 평균 제곱 거리이며 회귀선까지의 평균 제곱 거리보다 훨씬 큽니다.
와이나는와이와이^나는