Wikipedia 정의를 살펴보면 :
그것은 나에게 보인다
여기서 은 샘플 수이고 는 의 추정치입니다 .
그러나 위키피디아 기사 중 어느 것도이 관계를 언급하지 않습니다. 왜? 뭔가 빠졌습니까?
Wikipedia 정의를 살펴보면 :
그것은 나에게 보인다
여기서 은 샘플 수이고 는 의 추정치입니다 .
그러나 위키피디아 기사 중 어느 것도이 관계를 언급하지 않습니다. 왜? 뭔가 빠졌습니까?
답변:
실제로 Wikipedia 의 평균 제곱 오류 의 회귀 섹션에 언급되어 있습니다 .
회귀 분석에서 평균 제곱 오차라는 용어는 때때로 오차 분산의 편견없는 추정 : 잔차 제곱을 자유도 수로 나눈 값을 나타내는 데 사용됩니다.
여기에서 몇 가지 정보를 찾을 수 있습니다. 통계의 오차 및 잔차 식 평균 제곱 오차는 경우에 따라 다른 의미를 가질 수 있으며 때로는 까다 롭습니다.
그러나 SSE (Sum of Squared Erros)와 RSS (Residue Sum of Squares)는 때때로 교환으로 사용되므로 독자들을 혼란스럽게합니다. 예를 들어 선형 회귀에 대한 자세한 내용은 이 URL ( https://365datascience.com/sum-squares/) 을 확인하십시오 .
통계적 관점에서 볼 때, 오류와 잔차는 완전히 다른 개념입니다. 오차는 주로 실제 관측 된 표본 값과 예측 된 값의 차이를 나타내며, 주로 RMSE (root Means Squared Errors) 및 MAE (Mean Absollute Errors)와 같은 통계 지표에 사용됩니다. 반대로, 잔차는 종속 변수와 선형 회귀 분석의 차이를 독점적으로 나타냅니다.
우리가 MSE를 RMSE의 sqaure로 생각한다면 이것이 이것이 옳지 않다고 생각합니다. 예를 들어, 예측 및 관측에 대한 일련의 샘플링 된 데이터가 있으며 이제 관측치 (O) = a + b X 예측 (P)과 같은 선형 회귀를 시도합니다. 이 경우 MSE는 O와 P의 차를 제곱하여 샘플 크기 N으로 나눈 값의 합입니다.
그러나 선형 회귀의 수행 방식을 측정하려면 MSR (Mean Squared Residue)을 계산해야합니다. 같은 경우, 선형 회귀에서 도출 된 예측 된 관측치와 실제 관측치 간의 차의 제곱합에 해당하는 RSS (잔차 제곱합)를 먼저 계산 한 다음 RSS를 N-2 로 나눈 값을 따릅니다. MSR을 받으십시오.
간단히 말해, 예에서 RSS 구성 요소는 더 이상 MSE를 계산하는 데 사용되는 구성 요소와 동일하지 않으므로 RSS / N을 사용하여 MSE를 추정 할 수 없습니다.