회귀 분석의 Wald 테스트 (OLS 및 GLM) : t- vs. z- 분포


22

회귀 계수에 대한 Wald 검정은 무증상으로 유지되는 다음 특성을 기반으로한다는 것을 이해합니다 (예 : Wasserman (2006) : All of Statistics , 153, 214-215) : 여기서 는 추정 회귀 계수, 은 회귀 계수의 표준 오차를 나타내고 은 관심 값입니다 ( 은 계수가 0과 크게 다릅니다. 크기 그래서 월드 테스트는 다음과 같습니다 거부 때β

(β^β0)se^(β^)(0,1)
β^se^(β^)β0β0αH0||>α/2 여기서
=β^se^(β^).

그러나 lmR에서 로 선형 회귀를 수행 할 때는 회귀 계수가 0과 유의하게 다른지 여부를 테스트하기 위해 값 대신 값이 사용됩니다 . 또한 R 의 출력은 때때로 테스트 통계로 및 제공 합니다. 분명히, 값은 분산 매개 변수가 알려져 있다고 가정 될 때 사용되고 값은 분산 매개 변수가 시뮬레이션 될 때 사용됩니다 ( 이 링크 참조 ).summary.lmglm

계수와 표준 오차의 비율이 표준 정규 분포로 가정되는 경우에도 왜 분포가 Wald 검정에 사용 되는지 설명 할 수 있습니까?

질문에 답변 한 후 편집

이 게시물 은 질문에 유용한 정보를 제공합니다.


2
보고되는 검정 통계량이 반드시 Wald 검정이라고 생각하는 이유는 무엇입니까?
Glen_b-복지 주 모니카

3
또는 값은 항상 계수를 표준 오차 in 및로 나눈 값 이기 때문 입니다. lmglm
COOLSerdash

답변:


20

glm포아송 분포 를 사용한 결과는 포아송 분포 를 사용 하면 평균 및 분산 모수가 동일하므로 값을 제공합니다 . 포아송 모형에서는 단일 모수 ( λ ) 만 추정하면됩니다 . A의 둘 다 평균 추정해야 할 곳 분산 매개 변수를, 당신은 볼 수 t의 사용 - 분포를.λglm

표준 선형 회귀 분석의 경우 오차 항이 정규 분포라고 가정합니다. 여기서 분산 모수는 추정되어야하므로 검정 통계량에 분포를 사용해야 합니다. 오차항에 대한 모집단 분산을 어떻게 든 알고 있다면 대신 z -test 통계를 사용할 수 있습니다 .

게시물에서 언급했듯이 테스트 분포는 무증상 정상입니다. - 분포는 점근 정상이므로 큰 샘플에서의 차이는 무시할 수있다.


3

GLM 프레임 워크에서 일반적으로 언급 한 W 테스트 통계 정규 정규 분포이므로 R z 값 에서 볼 수 있습니다 .

노멀 분산 응답 변수 선형 모델, 즉 GLM를 처리 할 때 그뿐만 아니라, 검정 통계량의 분포 입니다 학생의 t 너무에서, R 당신이 t의 값을.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.