분산과 평균 제곱 오차의 차이는 무엇입니까?


27

이것이 이전에 요청되지 않은 것에 놀랐지 만 stats.stackexchange에서 질문을 찾을 수 없습니다.

정규 분포 표본의 분산을 계산하는 공식입니다.

(XX¯)2n1

다음은 간단한 선형 회귀 분석에서 관측치의 평균 제곱 오차를 계산하는 공식입니다.

(yiy^i)2n2

이 두 공식의 차이점은 무엇입니까? 내가 볼 수있는 유일한 차이점은 MSE가 사용한다는 것 입니다. 이것이 유일한 차이점이라면 왜 그것들을 둘 다 분산이라고하지만 다른 자유도를 가진 것으로 간주하지 않습니까?n2


그것은 위키 피 디아 페이지에 대한 무엇입니까 여기 분명하지 않다?
TrynnaDoStat

3
분산은 평균에서 관측치의 제곱 편차 평균입니다. 대조적으로 MSE는 실제 값으로부터 예측의 제곱 편차 평균입니다.
random_guy

3
"분산"과 "평균 제곱 오류"는 여러 수식과 다양한 응용 프로그램이 있습니다. 질문을 명확히하기 위해 (a) 이러한 개념을 적용 할 데이터 종류를 설명하고 (b) 수식을 제공 할 수 있습니까? (그렇게함으로써 여러분의 질문에 대한 답도 알게 될 것입니다.)
whuber

6
보다 일반적인 공식은 다음과 같습니다. 여기서 는 를 얻는 데 추정되는 매개 변수의 수입니다. P의 Yi(yiy^i)2nppy^
Glen_b-복귀 모니카

@Glen_b이 일반 공식에 대한 자세한 정보를 제공 할 수 있습니까?
trianta2

답변:


28

OLS에 대해 작성한 평균 제곱 오류는 무언가를 숨기고 있습니다.

in(yiy^i)2n2=in[yi(β^0+β^xxi)]2n2

분자는 와 의 함수에 합산 되므로 각 변수에 대한 자유도를 잃으므로 입니다. 표본 분산에 대한 공식에서 분자는 단일 변수의 함수이므로 분모에서 자유도를 1 개만 잃습니다.yxn2

그러나 이들은 개념적으로 비슷한 수량이라는 것을 인식하고 있습니다. 표본 분산은 표본 평균 주변의 데이터 확산 (제곱 단위)을 측정하는 반면 MSE는 표본 회귀선 주변의 데이터 수직 확산 (제곱 수직 단위)을 측정합니다.


@amoeba 이봐! 관심을 가져 주셔서 감사합니다. 이 편집을 촉발 한 공식 CV 스타일 가이드가 있습니까? 그렇다면 배우고 싶습니다. 글쎄, 글쎄, 글렌 _b는 나에게 개인적 스타일 선호와 다른 Qs와 As에 대한 편집으로 식민지가 된 것에 대해 한 번 나에게 훈계했다. 어떻게 생각해? (그리고 나는 이것을 공동의 톤으로 묻습니다. 당신의 편집이 무언가를 추가한다고 생각합니다. 편집 값을 더 잘 이해하고 싶습니다.)
Alexis

1
나는이 제안을 공식 CV 스타일 가이드는 없다고 생각하지만, 라텍스가 인라인 텍스트 블록에 직접 렌더링 (1 달러 기호로 표시) 공식 및 표시 수식 (이 개 달러 기호로 표시) 별도의 줄에 렌더링됩니다. 표시된 수식은 다른 레이아웃을 사용합니다. 공식은 원래 별도의 줄에 있었지만 1 달러 기호로 표시되었습니다. 나는 이것이 의미가 없다고 생각합니다. 그러나 개인 취향에 대해서는 맞으므로 사과하여 자유롭게 롤백하십시오. 내가 편집 한 이유는 어쨌든 Q에서 오타를 수정했기 때문입니다.
amoeba는

어떤 절편 용어가 없으면 회귀 문제에서, 그때 MSE의 자유도가 같은지 대신에 분산 식 같은 n - 1 n - 2β0n1n2
develarist

1

분산 공식에서 표본 평균은 모집단 평균과 비슷합니다. 표본 평균은 데이터 점 으로 주어진 표본에 대해 계산됩니다 . 표본 평균을 알면 번째 데이터 점이 표본 평균에 의해 제약되므로 분산 공식의 분모에서 ( ) 자유도 (DOF)가 독립적 인 데이터 점만 남게 됩니다 .nn1nn 1n1

(Y의 추정 값을 얻기 위해 MSE를 식)에서, 우리는 모두 추정해야 뿐만 아니라 (즉, 차단)를 (즉, 기울기)이므로 2 DOF를 잃어 버리므로 MSE 공식의 분모에서 ( ) 의 이유입니다 .=β0+β1×xβ0β1n2

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.