vcovHC, vcovHAC, NeweyWest – 어떤 기능을 사용해야합니까?

올바른 표준 오류 및 테스트를 얻기 위해 lm () 기반 모델을 업데이트하려고합니다. 어떤 VC 매트릭스를 사용 해야할지 혼란 스럽습니다. sandwich패키지 제공 vcovHC, vcovHAC및 NeweyWest. 전자는 이질성 만 설명하지만 후자는 두 가지 상관 관계와 이질성 인식을 모두 설명합니다. 그러나 문서는 후자 두 가지의 차이점에 대해별로 설명하지 않습니다 (적어도 나는 그것을 얻지 못합니다). 함수 자체를 살펴보면 NeweyWest가 실제로 vcovHAC를 호출한다는 것을 깨달았습니다.

경험적 결과 coeftest(mymodel, vcov. = vcovHAC)와는 coeftest(mymodel, vcov. = NeweyWest)미친 다릅니다. vcovHAC순진한 영화 결과에 다소 근접 하지만 NeweyWest를 사용하면 모든 계수가 중요하지 않습니다 (테스트는 1에 가깝습니다).

regression time-series neweywest

— hans0l0
소스

일반적으로 R 도움말 페이지는 기사에 대한 링크를 제공합니다. 정확한 세부 사항은 대개 거기에 있습니다. 예를 들어 Zeileis 기사는 무료로 제공되며 풍부한 정보가 포함되어 있습니다.

— mpiktas

Zeileis 기사는 구체적 vcovHAC으로와 다른 점을 설명 NeweyWest합니다. 요약하면, 다른 HAC 방법은 가중치 선택에 따라 다릅니다. NeweyWest지정된 가중치를 가지며, vcovHAC고유 한 가중치를 제공 할 수있는 기본 기능이며 기본적으로 Andrews 가중치를 사용합니다.

— mpiktas

@mpiktas : 요약을위한 thx. 가중치를 지정하지 않았으므로 각각의 기본 가중치를 사용해야합니다. 이제 vcovHAC와 NeweyWest의 서로 다른 기본 가중치가 왜 그렇게 큰 차이를 만들고 가중치를 결정 하는가? STATA 또는 다른 패키지가 사용하는 가중치를 알고 있습니까?

— hans0l0

모든 계산은 사실에 의존 경우, 고정 변수 회귀 변수가 있으며 교란된다. 고정 성은 약간 제한적인 속성이므로 유지 여부를 확인하십시오.

x_{t} u_{t}

$x_tu_t$

x_{t}

$x_t$

u_{t}

$u_t$

— mpiktas

문제의 "샌드위치"는 관찰 된 정보에 의해 정의 된 고기를 포함하는 예상 정보에 의해 정의 된 두 개의 빵 조각이다. 여기 와 여기에 내 의견을 참조 하십시오 . 선형 회귀 분석의 경우 추정 방정식은 다음과 같습니다.

U (β) = X^{T} (Y - X^{T} β)

$U(\beta) = \mathbf{X}^T\left(Y - \mathbf{X}^T\beta\right)$

예상 정보 (빵)는 다음과 같습니다.

A = \frac{\partial U (β)}{\partial β} = - (X^{T} X)

$A = \frac{\partial U(\beta)}{\partial \beta} = -(\mathbf{X}^T\mathbf{X})$

관찰 된 정보 (고기)는 다음과 같습니다.

B = E (U (β) U (β)^{T}) = X^{T} (Y - X^{T} β) (Y - X^{T} β)^{T} X

$B = E(U(\beta)U(\beta)^T) = \mathbf{X}^T(Y-\mathbf{X}^T\beta)(Y-\mathbf{X}^T\beta)^T\mathbf{X}$

내부 항은 균일 성, 독립 데이터 가정이 충족 될 때 상수 잔차의 대각선이며, 의해 주어진 샌드위치 공분산 추정기 는 일반적인 선형 회귀 공분산 행렬 여기서 는 잔차의 분산입니다. 그러나 그것은 다소 엄격합니다. 잔차 행렬 과 관련된 가정을 완화하여 상당히 광범위한 추정량을 얻을 수 있습니다 . . $A^{-1}BA^{-1}$ $\sigma^2 \left(\mathbf{X}^T\mathbf{X}\right)^{-1}$ $\sigma^2$ $n \times n$

R = (Y - X^{T} β) (Y - X^{T} β)

$R = (Y-\mathbf{X}^T\beta)(Y-\mathbf{X}^T\beta)$

"HC0" vcovHC추정기는 데이터가 독립적이지 않은 경우에도 일관됩니다. 따라서 잔차가 독립적이라고 가정하지는 않지만 "작동하는 독립 공분산 구조"를 사용한다고 말할 것입니다. 그런 다음 행렬 은 잔차의 대각선으로 대체됩니다. $R$

R_{i i} = (Y_{i} - β X_{I .})^{2}, 0 elsewhere

$R_{ii} = (Y_i - \beta \mathbf{X}_{I.})^2, \quad 0\text{ elsewhere}$

이 추정기는 작은 표본 (<40이 종종 추출 됨)을 제외하고는 실제로 잘 작동합니다. HC1-3은 다양한 유한 샘플 보정입니다. HC3가 일반적으로 최고 성능입니다.

그러나 자기 회귀 효과가있는 경우 대각선을 벗어난 항목은 0이 아니므로 일반적으로 사용되는 자기 회귀 구조를 기반으로 스케일 공분산 행렬이 생성됩니다. 이것이 "vcovHAC"의 이론적 근거입니다. 여기에서 자기 회귀 효과를 추정하기 위해 매우 유연하고 일반적인 방법이 만들어집니다. 세부 사항은 질문의 범위를 벗어납니다. "meatHAC"기능은 일반적인 주요 기능입니다. 기본 방법은 Andrews입니다. Newey-West는 일반적인 자기 회귀 오류 추정기의 특별한 경우입니다. 이 방법은 다음 두 가지 문제 중 하나를 해결합니다. 1. "인접한"관측치 간의 상관 관계가 어느 정도 감소하고 2. 두 관측치 사이의 합리적인 거리는 얼마입니까? 패널 데이터를 균형있게 조정 한 경우이 공분산 추정기는 과도합니다. $T$ geegee패키지는 공분산 구조를 AR-1유사하게 지정합니다 .

어느 것을 사용 해야하는지는 데이터 분석의 성격과 과학적 질문에 달려 있습니다. 여러 유형의 테스트 문제이므로 모든 유형을 맞추고 가장 적합한 유형을 선택하는 것은 좋지 않습니다. 앞서 언급했듯이 vcovHC 추정기는 자기 회귀 효과가 존재하더라도 일관성이 있으므로 다양한 상황에서 "작업 독립성 상관 관계 모델"을 사용하고 정당화 할 수 있습니다.

— AdamO
소스