당신은 할 수 없습니다 OLS 추정의 일관성을 위해 4 순간에 대한 가정이 필요하지만, 당신은 더 높은 순간에 필요한 가정을x 과 ϵ 점근 적 정상 성을 위해 그리고 점근 적 공분산 행렬이 무엇인지 지속적으로 추정하기 위해.
그러나 어떤 의미에서 이것은 실제적인 포인트가 아니라 수학적, 기술적 포인트입니다. 어떤 의미에서 OLS가 유한 샘플에서 잘 작동하려면 점근 적 일관성 또는 정규성을 달성하는 데 필요한 최소한의 가정 이상이 필요합니다.n→∞.
일관성을위한 충분한 조건 :
회귀 방정식이있는 경우 :
yi=x′iβ+ϵi
OLS 추정기 는 다음과 같이 쓸 수 있습니다 :
b^
b^=β+(X′Xn)−1(X′ϵn)
대한 일관성 , 당신은 그래서은 Karlin와 테일러의 에르고 드적 정리 등의 일련 의존, 뭔가 시계열의 경우, 많은 수의 콜 모고 로프의 법칙을 적용하거나 할 수 있어야합니다 :
1nX′X→pE[xix′i]1nX′ϵ→pE[x′iϵi]
필요한 다른 가정은 다음과 같습니다.
- E[xix′i] 은 전체 순위이므로 행렬은 되돌릴 수 없습니다.
- 회귀자는 되도록 미리 정해 지거나 엄격하게 외생 적 입니다.E[xiϵi]=0
그런 다음 그리고(X′Xn)−1(X′ϵn)→p0b^→pβ
당신이 중심 극한 정리 적용 할 경우 다음 당신은 예를 들어, 높은 순간에 대한 가정이 필요 어디 . 중심 한계 정리는 의 점근 적 정규성을 제공 하고 표준 오류에 대해 이야기 할 수있게하는 것입니다. 두 번째 순간 존재하는, 당신의 4 순간 필요 와 존재. 그 주장 할 여기서E[gig′i]gi=xiϵib^E[gig′i]xϵn−−√(1n∑ix′iϵi)→dN(0,Σ)Σ=E[xix′iϵ2i] . 이것이 작동하려면 는 유한해야합니다.Σ
하야시의 계량 경제학 (Econometrics )에 좋은 토론이 있다 (4 번째 모멘트 및 공분산 행렬 추정에 대해서는 149 페이지도 참조하십시오.)
토론:
네 번째 순간에 대한 이러한 요구 사항은 아마도 실질적인 포인트가 아닌 기술적 인 포인트 일 것입니다. 일상적인 데이터에서 이것이 문제인 병리학 적 분포를 겪지 않을 것입니까? OLS에 대한 더 일반적인 또는 다른 가정이 잘못되었습니다.
의심 할 여지없이 Stackexchange의 다른 곳에서 대답하는 다른 질문은 유한 샘플이 점근 적 결과에 가까워지기 위해 필요한 샘플의 양입니다. 환상적인 특이 치가 수렴을 느리게하는 의미가 있습니다. 예를 들어, 분산이 매우 큰 로그 정규 분포의 평균을 추정 해보십시오. 표본 평균은 모집단 평균의 일관되고 편향되지 않은 추정량이지만, 과도한 과도한 첨도 등이있는 로그-정상 사례 (링크 따르기)에서 유한 표본 결과는 실제로 상당히 벗어납니다.
유한 대 무한은 수학에서 매우 중요한 차이점입니다. 그것은 일상 통계에서 발생하는 문제가 아닙니다. 실제 문제는 작은 범주와 큰 범주에 더 가깝습니다. 분산, 첨도 등이 표본 크기에 따라 합리적인 추정치를 얻을 수있을 정도로 작습니까?
OLS 추정기가 일관되지만 무증상으로 정상이 아닌 병리학 적 예
치다:
yi=bxi+ϵi
여기서 이지만 는 자유도가 2 인 t- 분포에서 추출되므로 입니다. OLS 추정치는 확률 수렴 하지만 OLS 추정치 대한 표본 분포 는 정규 분포가 아닙니다. 다음은 10000 개의 관측치가있는 회귀에 대한 10000 개의 시뮬레이션을 기반으로하는 대한 경험적 분포입니다 .
xi∼N(0,1)ϵiVar(ϵi)=∞bb^b^
의 분포는 정상이 아니며 꼬리가 너무 무겁습니다. 그러나 의 두 번째 순간이 존재 하도록 자유도를 3으로 늘리면 중앙 제한이 적용되어 다음을 얻습니다.
b^ϵi
그것을 생성하는 코드 :
beta = [-4; 3.7];
n = 1e5;
n_sim = 10000;
for s=1:n_sim
X = [ones(n, 1), randn(n, 1)];
u = trnd(2,n,1) / 100;
y = X * beta + u;
b(:,s) = X \ y;
end
b = b';
qqplot(b(:,2));