왜의 추적


13

모델 에서 정규 방정식을 사용하여 를 추정 할 수 있습니다 .βy=Xβ+ϵβ

Y =X β .

β^=(XX)1Xy,
우리가 얻을 수있는
y^=Xβ^.

잔차 벡터는 다음과 같이 추정됩니다.

ϵ^=yXβ^=(IX(XX)1X)y=Qy=Q(Xβ+ϵ)=Qϵ,

여기서,

Q=IX(XX)1X.

내 질문은 tr ( Q ) = n - p 의 결론을 얻는 방법 입니다.

tr(Q)=np.

답변:


12

결론은 단지 벡터 공간의 크기를 계산합니다. 그러나 일반적으로 사실이 아닙니다.

선형 변환 행렬로 표현한다는 행렬 곱셈 쇼의 가장 기본적인 성질 만족H=X(XX)X

H2=(X(XX)X)2=X(XX)(XX)(XX)X=H,

프로젝션 오퍼레이터 로 전시 . 따라서 그 보완

Q=1H

(질문에 주어진) 또한 투영 연산자입니다. 의 추적 은 그 랭크 h (아래 참조)이며 Q 의 추적 은 n - h 입니다.HhQnh

매우 식으로부터는 것을 알 수있다 두 선형 변환의 조성물과 관련된 행렬 J = ( X ' X ) - X 'X 자체. (제 J가 )를 변형 n 개 - 벡터의 예를피의 - 벡터의 β . 제 ( X가 ) A로부터 변환 인 R의 PR N 주어진 Y = X βH

J=(XX)X
XJnypβ^XRpRny^=Xβ^. 최소 2 자릿수 설정에서 항상 (그러나 J 가 전체 순위가 아닐 때마다 p 보다 작을 수 있음 ). 결과적으로 조성물의 랭크 H는 = X J는 계급 초과 할 수 X를 . 그러므로 올바른 결론ppJH=XJX

J 가 풀 랭크 인경우에만 tr ( Q ) = n - p ; 그리고 일반적으로 n tr ( Q ) n - p . 전자의 경우, 모델은 "식별 가능"이라고한다 ( β 계수에 대해).tr(Q)=npJntr(Q)npβ

X ' X 가 뒤집을 수없는 경우에만 J 가 전체 순위가됩니다.JXX


기하학적 해석

n- 벡터 y ( "응답"또는 "종속 변수"를 나타냄)에서 X 의 열에 의해 확장 된 공간( "독립 변수"또는 "공변량"을나타냄)으로의 직교 투영을나타냅니다. 차이 Q = 1 - H 는 임의의 n- 벡터 y 를 벡터 y = H ( y ) + Q ( y ) 의 합으로분해하는 방법을 보여줍니다 . 여기서 첫 번째는 X 에서 "예측"될 수 있고두 번째는 그것에 수직입니다. . 때 pHnyXQ=1Hny

y=H(y)+Q(y),
Xp의 열 생성 P 차원 공간 (즉,하지 동일 선상)의 랭크 H는 이고 , p는 과의 랭크 Q가N - P , 반사 N을 - 페이지 표시되지 않은 응답 변동의 추가적인 치수 독립 변수 내에서. 트레이스는 이러한 치수에 대한 대수 공식을 제공합니다.XpHpQnpnp

선형 대수 배경

벡터 공간 ( (예를 들어, R n ) 상의 투영 연산자 는 P 2 = P가 되도록 선형 변환 P : V V (즉, V엔도 모르 프) 이다 . 이것은 그것의 보수 Q = 1 - P 도 투영 연산자로 만듭니다.VRnP:VVVP2=PQ=1P

Q2=(1P)2=12P+P2=12P+P=Q.

모든 돌기마다 위해 그 이미지의 모든 요소를 해결 우리가 쓸 수 V = P ( w ) 일부 w V를 어디서, w = P ( V ) = P (2) ( V ) = P ( P ( v ) ) = P ( w ) .vIm(P)v=P(w)wV

w=P(v)=P2(v)=P(P(v))=P(w).

어떤 자기 사상의와 관련 V는 두 부분 공간이다 : 그것의 커널 KER ( P ) = { V VPV 이미지 Im ( P ) = { v v

ker(P)={vv|P(v)=0}
모든 벡터 V V는 폼에 기입 할 수 V = w + U 여기서 w ( P ) U ( P ) . 따라서 우리는 E Ker ( P ) F Im 인 V에 대한기초 E F 를만들 수있다
Im(P)={vv|wVP(w)=v}.
vV
v=w+u
wIm(P)uKer(P)EFVEKer(P) . 경우 V는 유한 차원이다의 행렬 P 이 기준에 따라서, 하나 개의 블록 (의 동작에 대응하여, 블록 대각 형태 일 것이다 P E ) 모두 제로 및 기타 (작용에 대응하는 P F )는 f by f 항등 행렬과 같습니다. 여기서 F 의 차원은 f 입니다. P 의 트레이스는대각선의 값의 합이므로 f × 1 = f 와 같아야합니다. 이 번호는입니다순위FIm(P)VPPEPFffFfPf×1=f : 이미지의 치수.P

미량의 의 추적 같음 1 (동일한 N 의 치수 V ) 마이너스 추적 P .1P1nVP

이러한 결과는 투영의 흔적이 그 순위와 같다는 주장으로 요약 될 수있다 .


매우 감사합니다. 나는 당신의 대답으로부터 많은 지식을 배웠습니다.
zhushun0008

19

@Dougal은 이미 답변을했지만 여기에 조금 더 간단한 답변이 있습니다.

tr(AB)=tr(A)tr(B)

tr(Q)=tr(I)tr(X(XX)1X).
In×ntr(I)=ntr(AB)=tr(BA)
tr(Q)=ntr((XX)1(XX)).
(XX)1(XX)p×pp
tr(Q)=np.

6

npX

X=UΣVTΣRp×pURn×p,VRp×pUTU=VTV=VVT=IpUUTpIn). 그때

X(XTX)1XT=UΣVT(VΣUTUΣVT)1VΣUT=UΣVT(VΣ2VT)1VΣUT=UΣVTVΣ2VTVΣUT=UUT.

U2Rn×npUn=[UU2]

IX(XTX)1XT=UnUnTUUT=Un(In[Ip000])UnT=Un[000Inp]UnT.
QQnppQnp
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.