F- 통계량이 F- 분포를 따른다는 증거


20

이 질문에 비추어 : OLS 모델의 계수가 (nk) 자유도의 t- 분포를 따르는 증거

왜 그런지 이해하고 싶습니다

F=(TSSRSS)/(p1)RSS/(np),

여기서 는 모형 모수 의 개수 이고 은 관측치의 수이며 는 총 분산이고, 는 잔차 분산은 분포를 따릅니다 .n T S S R S S F p 1 , n ppnTSSRSSFp1,np

어디서부터 시작해야할지 모르기 때문에이를 증명하려고 시도조차하지 않았 음을 인정해야합니다.


크리스토프 행크와 프랜시스는 이미 매우 좋은 대답을했습니다. 선형 회귀에 대한 f 증명 증명을 이해하는 데 여전히 어려움이 있으면 teamdable.github.io/techblog/… 를 확인 하십시오 . 선형 회귀에 대한 ftest의 증거에 대한 블로그 게시물을 작성했습니다. 한국어로 작성되었지만 거의 모든 것이 수학 공식이므로 문제가되지 않을 수 있습니다. 선형 회귀에 대한 f 검정의 증거를 이해하는 데 여전히 어려움이 있다면 도움이되기를 바랍니다.
오태호

이 링크가 질문에 대한 답변을 제공 할 수 있지만 여기에 답변의 필수 부분을 포함시키고 참조 용 링크를 제공하는 것이 좋습니다. 링크 된 페이지가 변경되면 링크 전용 답변이 유효하지 않을 수 있습니다. - 리뷰에서
mkt-

답변:


19

검정 통계량에 대한 공식이 특별한 경우 인 일반적인 경우에 대한 결과를 보여 드리겠습니다. 일반적으로, 우리는 통계량 F 분포특성에 따라 독립 χ2 rvs 의 비율 을 자유 도로 나눈 값 으로 쓰여질 수 있는지 확인해야합니다 .

하자 H0:Rβ=r 함께 Rr 알려진 랜덤하지 및 R:k×q 전체 열 랭크 갖는 q . 이는 상수 항을 포함하여 ( OP 표기법과 달리) k 회귀 에 대한 q 선형 제한을 나타냅니다 . 따라서 @ user1627466의 예에서 p - 1 은 모든 기울기 계수를 0으로 설정 하는 q = k - 1 제한에 해당합니다.kp1q=k1

감안 Var(β^ols)=σ2(XX)1 , 우리가

R(β^olsβ)N(0,σ2R(XX)1R),
그 (너무 B1/2={R(XX)1R}1/2 의 "행렬 제곱근"인B1={R(XX)1R}1 을 통해, 예를 들면, 촐레 스키 분해)
n:=B1/2σR(β^olsβ)N(0,Iq),
같은
Var(n)=B1/2σRVar(β^ols)RB1/2σ=B1/2σσ2BB1/2σ=I
두 번째 줄은 OLSE의 분산을 사용합니다.

이는 도시 된 바와 같이, 링크 한 것을 않음 (참조 여기 ), 독립적 인

d:=(nk)σ^2σ2χnk2,
여기서, σ 2=Y'MX(Y)/(N-K)과 일반적인 바이어스 오차의 분산 추정치이다MX는=I-X(X'X)-1X'인 에 미치지에서 "잔류 메이커 매트릭스"X.σ^2=yMXy/(nk)MX=IX(XX)1XX

따라서, nn 은 법선의 2 차 형태이므로

nnχq2/qd/(nk)=(β^olsβ)R{R(XX)1R}1R(β^olsβ)/qσ^2Fq,nk.
특히, 아래H0:Rβ=r,이 통계에 감소
F=(Rβ^olsr){R(XX)1R}1(Rβ^olsr)/qσ^2Fq,nk.

그림의 경우, 특별한 경우의 고려 R=I , 아르 자형=0 , =2 , σ 2 = 1X ' X = I를 . 그리고, F는 = β ' OLS β OLS / 2 = β 2 OLS , 1 + β 2 OLS , 2σ^2=1엑스'엑스=나는

F=β^olsβ^ols/2=β^ols,12+β^ols,222,
때문에, 그 강조 - OLS의 제곱 유클리드 거리 요소의 수에 의해 표준화 원점으로부터 견적β2OLS,2표준 법선 제곱되고 따라서χ(2)(1)F의분포가 '평균으로 간주 될 수있다χ2분포.β^ols,22χ12Fχ2

작은 시뮬레이션 (물론 증거는 아닙니다!)을 선호하는 경우 케이 회귀자가 중요하지 않은 것으로 null을 테스트 하여 null 분포를 시뮬레이션합니다.

여기에 이미지 설명을 입력하십시오

우리는 이론적 밀도와 Monte Carlo 테스트 통계의 히스토그램 사이에 매우 잘 일치하는 것으로 보입니다.

library(lmtest)
n <- 100
reps <- 20000
sloperegs <- 5 # number of slope regressors, q or k-1 (minus the constant) in the above notation
critical.value <- qf(p = .95, df1 = sloperegs, df2 = n-sloperegs-1) 
# for the null that none of the slope regrssors matter

Fstat <- rep(NA,reps)
for (i in 1:reps){
  y <- rnorm(n)
  X <- matrix(rnorm(n*sloperegs), ncol=sloperegs)
  reg <- lm(y~X)
  Fstat[i] <- waldtest(reg, test="F")$F[2] 
}

mean(Fstat>critical.value) # very close to 0.05

hist(Fstat, breaks = 60, col="lightblue", freq = F, xlim=c(0,4))
x <- seq(0,6,by=.1)
lines(x, df(x, df1 = sloperegs, df2 = n-sloperegs-1), lwd=2, col="purple")

질문과 답변의 테스트 통계 버전이 실제로 동등한 지 확인하려면 null이 제한 사항 아르 자형'=[0나는]아르 자형=0 입니다.

X = [ X 1 이라고하자X=[X1X2] 는 널 (null)에서 0으로 제한되는 계수에 따라 분할됩니다 (여러분의 경우 상수를 제외한 모든 것이 따르지만 파생은 일반적입니다). 또한하자 β OLS을 = ( β ' OLS는 , 1 , β ' OLS , 2 ) ' 적당하게 분배 OLS가 추정 될.β^ols=(β^ols,1,β^ols,2)

Rβ^ols=β^ols,2
R ' β OLS = β OLS , (2)
R(XX)1RD~,
우측 하단 블록
(XTX)1=(X1X1X1X2X2X1X2X2)1(A~B~C~D~)
이제 사용파티션 역함수에 대한 결과를얻었다
D~=(X2X2X2X1(X1X1)1X1X2)1=(X2MX1X2)1
여기서,MX1=IX1(X1X1)1X1 .

따라서, 분자의 F 통계 (의해 분할된다없이 q )

Fnum=β^ols,2(X2MX1X2)β^ols,2
바이 그 다음, 회수 Frisch- 워 - 로벨 정리 우리가 쓸 수 있습니다 β OLS를 , 2 = ( X ' 2 M X 1 X 2 ) -
β^ols,2=(X2MX1X2)1X2MX1y
이므로
Fnum=yMX1X2(X2MX1X2)1(X2MX1X2)(X2MX1X2)1엑스2'엑스1와이=와이'엑스1엑스2(엑스2'엑스1엑스2)1엑스2'엑스1와이

그것은이 분자가 동일 것을 보여주기 위해 남아 소련RSSR , 제곱 잔차의 제한 및 제한된 금액의 차이.

RSSR=와이'엑스1와이
와이엑스1H0에스에스=나는(와이나는와이¯)2

소련

엑스1와이엑스1엑스2

소련=와이'엑스1'엑스1엑스2엑스1와이=와이'엑스1'(나는엑스1엑스2)엑스1와이=와이'엑스1와이와이'엑스1엑스1엑스2((엑스1엑스2)'엑스1엑스2)1(엑스1엑스2)'엑스1와이=와이'엑스1와이와이'엑스1엑스2(엑스2'엑스1엑스2)1엑스2'엑스1와이

그러므로,

RSSR소련=와이'엑스1와이(와이'엑스1와이와이'엑스1엑스2(엑스2'엑스1엑스2)1엑스2'엑스1와이)=와이'엑스1엑스2(엑스2'엑스1엑스2)1엑스2'엑스1와이


감사. 이 시점에서 손을 잡는 것으로 생각되는지는 모르겠지만 제곱 베타 베타에서 제곱 합계를 포함하는 표현식으로 어떻게 이동합니까?
user1627466

1
@ user1627466에서 두 공식의 동등성을 도출했습니다.
Christoph Hanck

4

@ChristophHanck은 매우 포괄적 인 답변을 제공했으며 여기에 언급 된 특수 사례 OP에 대한 증거 스케치를 추가 할 것입니다. 다행히 초보자도 따라하기가 더 쉽기를 바랍니다.

와이에프1,2

와이=엑스1/1엑스2/2,
엑스1χ12엑스2χ22에프에프기음ESSχ12cRSSχnp2c

y=Xβ+ε,
엑스×ε(0,σ2나는)H=엑스(엑스엑스)1엑스와이^=H와이=나는HHtr(H)=H엑스=엑스

J

TSS=와이(나는1J)와이,RSS=와이와이,ESS=와이(H1J)와이.
+(HJ/)+J/=나는J/계급()+계급(HJ/)+계급(J/)=HJ/(HJ/)=0

에프에프

  1. 엑스(μ,Σ)에이아르 자형에이Σ엑스에이엑스χ아르 자형2(μ에이μ/2)χ2아르 자형μ에이μ/2증거도 여기 에서 찾을 수 있습니다 .
  2. 엑스(μ,Σ)에이Σ=0엑스에이엑스엑스엑스

와이(엑스β,σ2나는)

ESSσ2=(와이σ)(H1J)와이σχ12((엑스β)(HJ)엑스β).
β=0ESS/σ2χ12와이와이=εεH엑스=엑스RSS/σ2χ2(HJ/)=0ESS/σ2RSS/σ2
F=(TSSRSS)/(p1)RSS/(np)=ESSσ2/(p1)RSSσ2/(np)Fp1,np.
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.