회귀에 관한 교과서를 읽는 동안 나는 다음 단락을 만났다.
선형 회귀 계수 ( ) 의 벡터의 최소 제곱 추정값 은 다음과 같습니다.
데이터 의 함수로 볼 때 (예측 변수 X 를 상수로 간주 ) 데이터의 선형 조합입니다. 중앙 한계 정리를 사용하면 표본 크기가 크면 β 분포 가 대략 다변량 정규 분포임을 알 수 있습니다 .
나는 분명히 텍스트에서 무언가를 잃어 버렸지 만 단일 값이 어떻게 분포를 가질 수 있는지 이해할 수 없습니까? 본문에서 언급 된 분포를 얻기 위해 여러 β 값 이 어떻게 생성됩니까?
4
는 회귀 계수로 구성된 벡터입니다. 혼란을 해결합니까?
—
매크로
@Taylor 그러나 내가 아는 유일한 것이 "샘플 크기가 크다"는 것이라면 B의 분포를 어떻게 알 수 있습니까?
—
upabove
@Taylor 회귀 모델의 오차 성분이 평균이 0이고 일정하게 분산 된 가우시안 인 경우에만 베타 vactor의 개별 구성 요소가 분포합니다. 비정규의 경우 귀무 가설 하에서 분포를 반드시 알 필요는 없지만 여전히 무정형 일 수 있습니다. 그러나 whuber가 말한 것처럼 중앙 한계 정리는 가중 평균이기 때문에 유지하지 못할 수 있으며 가중치가 몇 용어가 합계를 지배하는 방식으로 표본 크기와 일치하지 않는다는 것을 알아야합니다.
—
Michael R. Chernick