선형 회귀 : * 왜 * 제곱합을 분할 할 수 있습니까?


9

이 게시물은 이변 량 선형 회귀 모델을 나타냅니다. Yi=β0+β1xi. 나는 항상 총 제곱합 (SSTO)을 오차의 제곱합 (SSE)과 모델의 SSR (제곱합)으로 나누었다. 작동합니까?

나는이 부분 않는 이해 :

yi : y의 관측 값

y¯: 모든 관측 된 의 평균yi

y^i : 주어진 관측치의 x에 대한 y의 적합 / 예측 값

yiy^i: 잔차 / 오류 (제곱하고 모든 관측치에 대해 합산 한 경우 SSE 임)

y^iy¯: 모형 적합치가 평균과 얼마나 다른지 (모든 관측치에 대해 제곱 및 합산 한 경우 SSR 임)

yiy¯: 관측 값이 평균과 얼마나 다른지 (모든 관측에 대해 소급하여 합산 한 경우 SSTO 임)

왜 한 번의 관찰만으로도 아무런 문제를 일으키지 않고 이해할 수 있습니다. (yiy¯)=(y^iy¯)+(yiy^i). 그리고 왜 모든 관측치에 물건을 더하고 싶다면 제곱해야하거나 0을 더하는 이유를 이해할 수 있습니다.

내가 이해하지 못하는 부분은 왜 (yiy¯)2=(y^iy¯)2+(yiy^i)2(예 : SSTO = SSR + SSE). 당신이 상황이있는 경우에 보인다A=B+C그런 다음 A2=B2+2BC+C2아니 A2=B2+C2. 왜 그렇지 않습니까?


5
마지막 단락에서 요약을 생략했습니다. SST = SSR + SSE는 합계입니다i그러나 거기에 요약 부호가 없으면 실제로 사실이 아니기 직전에 쓴 평등입니다.
Glen_b-복지 주 모니카

1
마지막 단락에서는 SSTO = SSR + SSE를 원하지 않습니다 (예 : SSTO = SSR + SSE). "예"는 영어로 라틴어 " exempli gratia "또는 "예를 들어" 의 약어입니다 . "ie"는 " id est " 의 약자 이며 영어로 "즉"로 읽을 수 있습니다.
Matthew Gunn

답변:


9

당신이 상황이있는 경우에 보인다 A=B+C그런 다음 A2=B2+2BC+C2아니 A2=B2+C2. 왜 그렇지 않습니까?

개념적으로는 BC=0 때문에 BC 직교 (즉, 수직)이다.


여기서 선형 회귀와 관련하여 잔차 ϵi=yiy^i 비정형 예측과 직교 y^iy¯. 선형 회귀 예측은 다음과 같은 직교 분해를 생성합니다.y 비슷한 의미로 (3,4)=(3,0)+(0,4) 직교 분해입니다.

선형 대수 버전 :

허락하다:

z=[y1y¯y2y¯yny¯]z^=[y^1y¯y^2y¯y^ny¯]ϵ=[y1y^1y2y^2yny^n]=zz^

선형 회귀 (상수 포함) 분해 z 두 벡터의 합으로 : 예측 z^ 그리고 잔류 ϵ

z=z^+ϵ

허락하다 .,.내적을 나타냅니다 . (더 일반적으로,X,Y내부 제품이 될 수 있습니다 E[XY].)

z,z=z^+ϵ,z^+ϵ=z^,z^+2z^,ϵ+ϵ,ϵ=z^,z^+ϵ,ϵ

마지막 줄은 z^,ϵ=0 (즉 z^ϵ=zz^직교입니다). 증명할 수 있습니다z^ϵ 평범한 최소 제곱 회귀 분석의 구성 방식에 따라 직교합니다. z^.

z^선형 투영 입니다z회귀 자의 선형 범위 에 의해 정의 된 부분 공간으로x1, x2등 ... 잔류 물 ϵ 따라서 전체 부분 공간과 직교 z^ (이것은 x1, x2등)은 직교합니다. ϵ.


내가 정의 한대로 .,. 내적으로 z,z=z^,z^+ϵ,ϵ 단순히 또 다른 글쓰기 방법입니다 i(yiy¯)2=i(y^iy¯)2+i(yiy^i)2 (예 : SSTO = SSR + SSE)


8

요점은 특정 벡터가 직교하고 피타고라스 정리를 사용한다는 것을 보여줍니다.

다변량 선형 회귀를 고려해 봅시다 Y=Xβ+ϵ. 우리는 OLS 추정기가β^=(XtX)1XtY. 이제 견적을 고려하십시오

Y^=Xβ^=X(XtX)1XtY=HY (H 행렬은 "모자"행렬이라고도 함)

어디 H Y의 직교 투영 행렬입니다. S(X). 이제 우리는

YY^=YHY=(IH)Y

어디 (IH) 직교 보체에 투영 행렬입니다 S(X) 어느 S(X). 따라서 우리는YY^Y^ 직교합니다.

이제 하위 모델을 고려하십시오 Y=X0β0+ϵ

어디 X=[X0|X1] 마찬가지로 우리는 OLS 추정기와 추정치를 가지고 있습니다. β0^Y0^ 프로젝션 매트릭스 H0 위에 S(X0). 마찬가지로 우리는 그것을 가지고YY0^Y0^직교합니다. 그리고 지금

Y^Y0^=HYH0Y=HYH0HY=(IH0)HY

또 어디 (IH0) 의 보수에 직교 투영 행렬입니다 S(X0) 어느 S(X0). 따라서 우리는 직교성이Y^Y0^Y0^. 결국 우리는

||YY^||2=||Y||2||Y^||2=||YY0^||2+||Y0^||2||Y^Y0^||2||Y0^||2

그리고 마지막으로 ||YY0^||2=||YY^||2+||Y^Y0^||2

마지막으로 평균 Y¯ 단순히 Y0^ 널 모델을 고려할 때 Y=β0+e.


답변 주셔서 감사합니다! S () 란 무엇입니까 (게시물의 S (X)와 동일)?
bluemouse

S(X) 행렬의 열에 의해 생성 된 부분 공간입니다. X
Łukasz Grad
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.