회귀 계수의 다변량 정규 분포?


12

회귀에 관한 교과서를 읽는 동안 나는 다음 단락을 만났다.

선형 회귀 계수 ( ) 의 벡터의 최소 제곱 추정값 은 다음과 같습니다.β

β^=(XtX)1Xty

데이터 의 함수로 볼 때 (예측 변수 X 를 상수로 간주 ) 데이터의 선형 조합입니다. 중앙 한계 정리를 사용하면 표본 크기가 크면 β 분포 가 대략 다변량 정규 분포임을 알 수 있습니다 .yXβ

나는 분명히 텍스트에서 무언가를 잃어 버렸지 만 단일 값이 어떻게 분포를 가질 수 있는지 이해할 수 없습니까? 본문에서 언급 된 분포를 얻기 위해 여러 β 값 이 어떻게 생성됩니까?ββ


4
는 회귀 계수로 구성된 벡터입니다. 혼란을 해결합니까? β
매크로

5
ββ^

7
H=(XtX)1XtyHy

@Taylor 그러나 내가 아는 유일한 것이 "샘플 크기가 크다"는 것이라면 B의 분포를 어떻게 알 수 있습니까?
upabove

2
@Taylor 회귀 모델의 오차 성분이 평균이 0이고 일정하게 분산 된 가우시안 인 경우에만 베타 vactor의 개별 구성 요소가 분포합니다. 비정규의 경우 귀무 가설 하에서 분포를 반드시 알 필요는 없지만 여전히 무정형 일 수 있습니다. 그러나 whuber가 말한 것처럼 중앙 한계 정리는 가중 평균이기 때문에 유지하지 못할 수 있으며 가중치가 몇 용어가 합계를 지배하는 방식으로 표본 크기와 일치하지 않는다는 것을 알아야합니다.
Michael R. Chernick

답변:


5

ββ^β^β^β^

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.