OLS 모델의 계수가 (nk) 자유도의 t- 분포를 따르는 지 증명


29

배경

회귀 모형에 계수 가있는 정규 최소 제곱 모형이 있다고 가정합니다 . k

y=Xβ+ϵ

여기서 이다 계수들의 벡터는, 은 IS 설계 행렬 에 의해 정의 된β(k×1)X

X=(1x11x12x1(k1)1x211xn1xn(k1))
오류는 IID입니다 일반,
ϵN(0,σ2I).

에 대한 추정치를 로 설정하여 제곱합 오류를 최소화합니다.β

β^=(XTX)1XTy.

의 바이어스되지 않은 추정량 은 여기서 \ mathbf {\ hat {y}} \ equiv \ mathbf {X} \ mathbf {\ hat {\ beta}} ( ref ).σ2

s2=yy^2np
y^Xβ^

공분산 β^ 에 의해 주어진다 \ operatorname {COV} \ 좌측 (\ mathbf {\ 모자 {\ 베타}} \ 오른쪽) = \ 시그마 ^ 2 \ mathbf {C} \ mathbf {C} \ equiv (\ mathbf {X} ^ T \ mathbf {X}) ^ {-1} ( ref ).

Cov(β^)=σ2C
C(XTX)1

의문

어떻게 증명할 수에 대한 β^i ,

β^iβisβ^itnk
여기서 tnk 이다 (nk) 자유도의 t- 분포 및 \ hat {\ beta} _i 의 표준 오차는 s _ {\ hat {\ beta} _i} = s \ sqrt {c_ {ii}}β^i 로 추정됩니다 .sβ^i=scii

내 시도

나는 알고에 대한 에서 샘플 확률 변수 , 당신이 보여줄 수있는 LHS를 로 다시 작성하여 이고 numertor가 표준 정규 분포이고 분모가 df = (n-1) 인 Chi-square 분포의 제곱근이며 (n- 1) ( ref ). 따라서 df = (n-1) ( ref ) 의 t- 분포를 따릅니다 .nxN(μ,σ2)

x¯μs/ntn1
(x¯μσ/n)s2/σ2

이 증거를 내 질문으로 확장 할 수 없었습니다 ...

어떤 아이디어? 나는 이 질문에 대해 알고 있지만, 그들은 분명히 그것을 증명하지 않고, 단지 "각 예측자가 당신에게 어느 정도의 자유를 요구한다"고 말하는 경험 법칙을 제시합니다.


때문에 공동 일반 변수의 선형 조합이며, 이는 정규 분포를 갖는다. 따라서 모든 당신이 (1)이 설정된다 할 필요가 ; (2) 가 의 편견 추정량 임을 보여줍니다 . 그리고 (3) 의 자유도 가 합니다. 후자는이 사이트에서 stats.stackexchange.com/a/16931 과 같은 여러 곳에서 입증되었습니다 . 나는 당신이 이미 (1)과 (2)를 수행하는 방법을 알고 있다고 생각합니다. β^iE(β^i)=βisβ^i2Var(β^i)sβ^ink
whuber

답변:


32

이후 우리는 및 따라서 우리는 알고있는 각 구성 요소에 대한 의 , 여기서 는 IS 의 대각 원소 . 따라서, 우리는

β^=(XTX)1XTY=(XTX)1XT(Xβ+ε)=β+(XTX)1XTε
β^βN(0,σ2(XTX)1)
kβ^
β^kβkN(0,σ2Skk)
Skkkth(XTX)1
zk=β^kβkσ2SkkN(0,1).

표준 법선 벡터에서 Normal 등원 이차 형태의 분포에 대한 정리 의 진술에 주목하십시오 (녹색의 정리 B.8).

만약 및 대칭이다 멱등 후 분배 여기서 계급이다 .xN(0,I)AxTAxχν2νA

하자 나타낸다 회귀 잔류 벡터 및하자 잔류 메이커 매트릭스 (즉 ) . 이 대칭적이고 dem 등하 다는 것을 쉽게 확인할 있습니다.ε^

M=InX(XTX)1XT,
My=ε^M

하자 에 대한 추정 될 .

s2=ε^Tε^np
σ2

그런 다음 선형 대수를해야합니다. 다음 세 가지 선형 대수 특성에 유의하십시오.

  • dem 등원 행렬의 순위는 그 트레이스입니다.
  • Tr(A1+A2)=Tr(A1)+Tr(A2)
  • Tr(A1A2)=Tr(A2A1) 이 이고 가 경우 ( 이 속성은 아래에서 작동하는 데 중요합니다 )A1n1×n2A2n2×n1

따라서

rank(M)=Tr(M)=Tr(InX(XTX)1XT)=Tr(In)Tr(X(XTX)1XT))=Tr(In)Tr((XTX)1XTX))=Tr(In)Tr(Ip)=np

그런 다음

V=(np)s2σ2=ε^Tε^σ2=(εσ)TM(εσ).

표준 법선 벡터에서 stat 등원 2 차 형태의 분포에 대한 정리를 적용하면 (위에 설명되어 있음) 입니다.Vχnp2

당신이 가정 때문에 정규 분포, 다음 의 독립적 인 , 그리고 이후 의 함수이다 , 다음 또한 독립적 인 . 따라서 와 는 서로 독립적입니다.εβ^ε^s2ε^s2β^zkV

그런 다음 은 표준 제곱 분포와 카이 제곱 분포의 제곱근의 비율입니다. 자유 분포 의 특성 인 동일한 자유도 (즉, )를 . 따라서, 통계량 자유도를 갖는 분포 를 갖는다.

tk=zkV/(np)
npttktnp

그러면 대수적으로보다 친숙한 형태로 조작 될 수 있습니다.

tk=β^kβkσ2Skk(np)s2σ2/(np)=β^kβkSkks2=β^kβks2Skk=β^kβkse(β^k)

또한 부수적 인 질문 :에 대해 대칭이되기 위해Theorem for the Distribution of an Idempotent Quadratic Form in a Standard Normal Vector 도 필요하지 않습니까? 불행히도, 나는 Greene이 없기 때문에 Wikipedia가 당신과 같은 형식 임을 알았지 만 그 증거를 볼 수 없습니다 . 그러나 카운터 예제는 dem 등원 행렬 인 것 같습니다.이 값은 음수 값을 취할 수 있으므로 Chi-Squared가 아님)로 이어집니다 . ..AA=(1100)x12+x1x2
개렛

1
@Garrett 사과드립니다. 는 대칭적이고 dem 등 이어야합니다. 이 문서에서 정리 3으로 증명이 제공됩니다. www2.econ.iastate.edu/classes/econ671/hallam/documents/… 운 좋게도 은 대칭성이며 dem 등식 입니다. AM
Blue Marker

1
A 는 단순히 2 차 형태 행렬 표현입니다. 모든 2 차 형태는 대칭 표현을 가지므로 의 대칭 요구 사항은 정리의 진술에 내재되어 있습니다. (사람들은 2 차 형태를 나타 내기 위해 비대칭 행렬을 사용하지 않습니다.) 따라서 2 차 형태 는 행렬 고유하게 나타납니다. 이 아닌 . A(x1,x2)x12+x1x2A=(11/21/20)
whuber

1
이 과 독립적임을 암시하는 이유는 무엇 입니까? 거기에 따르지 않습니다. ϵN(0,σ2)β^ϵ^
Glassjawed

1
@Glassjawed 와 은 다변량 정규 분포이므로 상관 관계는 독립성을 의미합니다. 식 사용 및 행 위의 임을 알 수 있습니다 . β^ε^β^=β+(XX)1Xεε^=MεCov(β^,ε^)=0p×n
rzch
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.