회귀 계수에 대한이 편차-분산 트레이드 오프 란 무엇이며이를 도출하는 방법


9

에서 이 종이 ( 분산 구성 요소에 대한 베이 즈 추론 대조 에러 만하여 , 작성자 청구 Harville 1974) 는 "공지이어야 선형 회귀 경우

(yXβ)H1(yXβ)=(yXβ^)H1(yXβ^)+(ββ^)(XH1X)(ββ^)
y=Xβ+ϵ,
ϵN(0,H).

이것은 어떻게 잘 알려져 있습니까? 이것을 증명하는 가장 간단한 방법은 무엇입니까?


1
그것은에 위키 피 디아 ,이 '유도'를 참조하십시오.
user603

@ user603 링크를 더 선명하게 만드시겠습니까? 감사!
Sibbs Gambling

@ user603 죄송합니다. 링크가 어떻게 문제를 해결하는지 알 수 없습니다. 제 경우에는 등식이 Var (y) = bias + ... 정교 할 수 있습니까?
Sibbs Gambling

4
@SibbsGambling이 식은 가중 선형 회귀 공식에 두 가지 분산 관련 항이 있습니다. 왼쪽의 용어는 실제 모델 주위의 분산과 관련이 있습니다 (정밀도 행렬 의해 가중 됨 ). 오른쪽의 첫 번째 용어는 적합 모형 주위의 분산과 관련이 있습니다. 오른쪽의 두 번째 용어 는 치우침 의 제곱 과 관련이 있습니다. 이것이 편차-바이어스 트레이드 오프입니다. H1
EdM

답변:


6

방정식의 마지막 항은 다음과 같이 쓸 수 있습니다.

(XβXβ^)H1(XβXβ^).

이 형태에서 방정식은 흥미로운 것을 말합니다. 가 양의 정의와 대칭 이라고 가정하면 그 반대도 마찬가지입니다. 따라서 내부 제품 를 정의하여 지오메트리를 제공 할 수 있습니다. 위의 평등은 본질적으로 H<x,y>H1=xH1y

(XβXβ^)(yXβ^).

댓글 작성자가 이미 유도에 대한 링크를 남겼 기 때문에이 직관을 보여주고 싶었습니다.

편집 : 후손

LHS :

(yXβ)H1(yXβ)=yH1y2yH1Xβ+βXH1Xβ=(A)(B)+(C)

RHS :

(yXβ^)H1(yXβ^)+(ββ^)(XH1X)(ββ^)
=yH1y2yH1Xβ^+β^XH1Xβ^+βXH1Xβ2β^XH1Xβ+β^XH1Xβ^=(A)(D)+(E)+(C)(F)+(E)

관계:

β^=(XH1X)1XH1y

관계를 연결하여 (B) = (F) 및 2 (E) = (D)를 표시 할 수 있습니다. 다 했어요


링크가 어떻게 문제를 해결하는지 알 수 없습니다. 제 경우에는 등식이 Var (y) = bias + ... 정교 할 수 있습니까?
Sibbs Gambling

@SibbsGambling은 파생을 포함하여 내 답변을 편집했습니다.
jlimahaverford

@jlimahaverford 당신 은 에 대한 공식의 끝 에서 를 잊지 않습니까? yβ^
Gumeo

7

그들은 정사각형을 완성하는 기술 로이 정체성에 도달합니다. 왼쪽은 이차 형태이므로 곱해서 시작합니다

(yXβ)H1(yXβ)=yH1y2yH1Xβ+βXH1Xβ

계속 한 다음 . 대수는 일종의 길지만 베이지안 회귀에서 사각형을 완성하는 인터넷 검색이며 많은 힌트를 찾을 수 있습니다. 예를 들어, 베이지안 선형 회귀 에 대한 Wikipedia 및 여기 에서와 같이 사각형 완성에 관한 다른 CrossValided 답변을 참조하십시오 . β^=(XH1X)1XH1y


2

행렬 대수를 알고 있다면 모든 것을 곱하고 실제로 양쪽이 동일하다는 것을 확인하면 가능합니다. 이것이 jlimahaverford가 증명 한 것입니다.

이를 위해서는 추정치 공식이 필요합니다 . 상관 관계가없는 오차 항이있을 때 선형 회귀와 유사한 방식으로 공식을 도출 할 수 있습니다. 비결은 표준화하는 것입니다.β^

다음 은 다변량 정규 분포에서 나오는 RV를 표준화하는 방법에 대한 정보입니다. 이 있다고 가정 해 봅시다 는 양의 정의이므로 로 인수 분해 할 수 있습니다 . 이제 임의 변수 는 분포에서 나옵니다 . 이제이 트릭을 사용하여 를 찾을 수 있습니다. 인수 분해합시다 . 우리가 지금 은 표준화되어

XN(μ,Σ).
ΣΣ=PPT
Y=P1(Xμ)
N(0,I)β^H=PPT
y=Xβ+ϵP1y=P1Xβ+P1ϵ
ϵcov(P1ϵ)=I 이므로 이제 이것을 다음과 같은 간단한 다중 선형 회귀 모델로 취급 할 수 있습니다. 따라서 회귀 문제가 있습니다. 의 공식 은 이것이 할 열쇠입니다 이것의 나머지는 jlimahaverford가 솔루션에서 보여준 대수적 조작입니다.
X~=P1X,y~=P1yandϵ~=P1ϵ.
y~=X~β+ϵ~
β^
β^=(X~TX~)1X~Ty~=((P1X)TP1X)1(P1X)TP1y=(XT(PPT)1X)1X(PPT)1y=(XTH1X)1XH1y
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.