문제의 "샌드위치"는 관찰 된 정보에 의해 정의 된 고기를 포함하는 예상 정보에 의해 정의 된 두 개의 빵 조각이다. 여기 와 여기에 내 의견을 참조 하십시오 . 선형 회귀 분석의 경우 추정 방정식은 다음과 같습니다.
U(β)=XT(Y−XTβ)
예상 정보 (빵)는 다음과 같습니다.
A=∂U(β)∂β=−(XTX)
관찰 된 정보 (고기)는 다음과 같습니다.
B=E(U(β)U(β)T)=XT(Y−XTβ)(Y−XTβ)TX
내부 항은 균일 성, 독립 데이터 가정이 충족 될 때 상수 잔차의 대각선이며, 의해 주어진 샌드위치 공분산 추정기 는 일반적인 선형 회귀 공분산 행렬 여기서 는 잔차의 분산입니다. 그러나 그것은 다소 엄격합니다. 잔차 행렬 과 관련된 가정을 완화하여 상당히 광범위한 추정량을 얻을 수 있습니다 . .A−1BA−1σ2(XTX)−1σ2n×n
R=(Y−XTβ)(Y−XTβ)
"HC0" vcovHC
추정기는 데이터가 독립적이지 않은 경우에도 일관됩니다. 따라서 잔차가 독립적이라고 가정하지는 않지만 "작동하는 독립 공분산 구조"를 사용한다고 말할 것입니다. 그런 다음 행렬 은 잔차의 대각선으로 대체됩니다.R
Rii=(Yi−βXI.)2,0 elsewhere
이 추정기는 작은 표본 (<40이 종종 추출 됨)을 제외하고는 실제로 잘 작동합니다. HC1-3은 다양한 유한 샘플 보정입니다. HC3가 일반적으로 최고 성능입니다.
그러나 자기 회귀 효과가있는 경우 대각선을 벗어난 항목은 0이 아니므로 일반적으로 사용되는 자기 회귀 구조를 기반으로 스케일 공분산 행렬이 생성됩니다. 이것이 "vcovHAC"의 이론적 근거입니다. 여기에서 자기 회귀 효과를 추정하기 위해 매우 유연하고 일반적인 방법이 만들어집니다. 세부 사항은 질문의 범위를 벗어납니다. "meatHAC"기능은 일반적인 주요 기능입니다. 기본 방법은 Andrews입니다. Newey-West는 일반적인 자기 회귀 오류 추정기의 특별한 경우입니다. 이 방법은 다음 두 가지 문제 중 하나를 해결합니다. 1. "인접한"관측치 간의 상관 관계가 어느 정도 감소하고 2. 두 관측치 사이의 합리적인 거리는 얼마입니까? 패널 데이터를 균형있게 조정 한 경우이 공분산 추정기는 과도합니다.Tgee
gee
패키지는 공분산 구조를 AR-1
유사하게 지정합니다 .
어느 것을 사용 해야하는지는 데이터 분석의 성격과 과학적 질문에 달려 있습니다. 여러 유형의 테스트 문제이므로 모든 유형을 맞추고 가장 적합한 유형을 선택하는 것은 좋지 않습니다. 앞서 언급했듯이 vcovHC 추정기는 자기 회귀 효과가 존재하더라도 일관성이 있으므로 다양한 상황에서 "작업 독립성 상관 관계 모델"을 사용하고 정당화 할 수 있습니다.