이 답변에서는 계량 경제학 문헌이 랜덤 효과 추정기라고 부르는 것에 대한 GLS 관점에 관한 Matthew의 +1 답변에 대해 조금 자세히 설명하고 싶습니다.
GLS 관점
선형 모델
가 있음을 개최하는 경우 우리는 단순히 의한 모델 추정 수 풀링 OLS 패널 데이터 구조를 무시 금액, 단순히 모든 덩어리 관측 함께 .
yit=α+Xitβ+uiti=1,…,m,t=1,…,T
E(uit|Xit)=0n=mT
우리는 모델 사용하여 오류 구성 요소 모델을uit
uit=ηi+ϵit
행렬 표기법에서 모델은
으로 쓸 수 있습니다. 여기서 와 은 일반적인 벡터입니다. 및 요소 이며 는 더미 변수 의 (단위당 하나의 열) 행렬입니다. 행 단위에 속하는 경우 관찰에 대응되도록이고 후, 칼럼의 하나를 갖는 및 다른 0, .
y=αιmT+Xβ+Dη+ϵ
yϵnyitϵitDn×mDiDii=1,…,m
또한
E(ϵϵ′)=σ2ϵI
개별 효과 는 과 독립적이어야합니다 . 랜덤 효과 추정기는 고정 효과와는 달리 (다시, 경제학 용어) 일하지만 추가적으로 강한 가정 필요
풀링 이러한 가정 하에서을 OLS는 편견이 없지만 GLS 추정기를 도출 할 수 있습니다. 가 평균 0이고 분산이 IID 라고 가정하십시오 .ηϵit
E(ηi|X)=0
ηiσ2η
이 가정은 임의 효과 라는 용어를 설명합니다 . 또한 두 오류 구성 요소가 독립적이라고 가정하면
Var(uit)Cov(uit,uis)Cov(uit,ujs)=σ2η+σ2ϵ=σ2η=0for all i≠j
우리는 다음 수 분산 - 공분산 행렬 :
여기에서,
는 와 벡터 1입니다. 우리는 따라서 쓸 수 있습니다
GLS에 추를 들어
우리는 합니다. 이를 위해 ,n×nΩ
Ω=⎛⎝⎜⎜⎜⎜ΣO⋮OOΣ⋮O⋯⋯⋯OO⋮Σ⎞⎠⎟⎟⎟⎟
Σ=σ2ηιι′+σ2ϵIT
ιTΩ=σ2η(Im⊗ιι′)+σ2ϵ(Im⊗IT)
β^RE=(X′Ω−1X)−1X′Ω−1y
Ω−1JT=ιι′J¯T=JT/TET=IT−J¯T . 그런 다음
또는 , 같은 행렬로 항을 모아서
등성 및 는
여기서 입니다.
Ω=Tσ2η(Im⊗J¯T)+σ2ϵ(Im⊗ET)+σ2ϵ(Im⊗J¯T)
Ω=(Tσ2η+σ2ϵ)(Im⊗J¯T)+σ2ϵ(Im⊗ET)
P=Im⊗J¯TQ=Im⊗ETΩ−1=1σ21P+1σ2ϵQ=−σ2ησ21σ2ϵ(Im⊗ιι′)+1σ2ϵ(Im⊗IT),
σ21=Tσ2η+σ2ϵ
임의 효과 추정이 유용 할 수있는 이유는, 만약 다수의 패널 데이터 애플리케이션에 매우 큰 풀 OLS 또는 고정 효과 주어진 가정 하에서 (제공보다 더 효율적으로 추정, 인과 가우스 - 마르코프 로직은, 설명 는 실제로 회귀 변수와 관련이 없습니다). 요컨대, 오차 공분산 행렬이이 모델에서 등분 산적이지 않기 때문에 GLS가 더 효율적입니다.ηi
부분적으로 측정되지 않은 데이터에서 OLS를 실행하면 GLS 추정값을 얻을 수 있음을 알 수 있습니다.
여기서 입니다. 들면 일 추정기 ( "내부")는 고정 효과를 얻는다. 를 들어 하나는 "사이"추정을 가져옵니다. GLS 추정값은 둘 사이의 가중 평균입니다. ( 경우 풀링 된 OLS 추정기를 얻습니다.)
(yit−θy¯i⋅)=(Xit−θX¯i⋅)β+(uit−θui⋅),
θ=1−ση/σ1θ=1θ→−∞θ=0
실현 가능한 GLS
FGLS 접근 방식을 실용화하려면 및 추정기가 필요합니다 . Baltagi, 패널 데이터의 계량 분석, p. 16 (제 3 판에서 인용), 진행 방법에 대한 다음 옵션에 대해 설명합니다.σ21σ2ϵ
먼저 관찰한다고 가정하십시오 . 그때,uit
σ^21=T1m∑i=1mu¯2i⋅
및
는 매개 변수를 잘 평가할 수 있으며 는 단위의 침해에 해당하는 시간 평균입니다. .
σ^2ϵ=1m(T−1)∑i=1m∑t=1T(uit−1m∑i=1mu¯i⋅)2
u¯i⋅i
월리스 후세인 (1969) 접근 대체 구성 (결국, 여전히 바이어스 본 가정하에 일치) 풀링 OLS 회귀의 잔차와.u
아메 미야 (1971) 접근 방식은 FE (또는 LSDV) 대신 잔차를 사용하여 제안합니다. 계산 문제로, 우리 는 를 얻을 수 있도록 더미 변수 트랩을 우회하기 위해 이라는 제한을 부과합니다. 와 통해 그랜드 평균을 나타내는 및 LSDV 잔차 위해 .∑iηi=0α^=y¯⋅⋅−X¯′⋅⋅β^FE⋅⋅itu^=y−α^−Xβ^FE
기본 Swamy and Arora (1972) 접근법은
및
여기에서 .
σ^2ϵ=[y′Q(I−X(X′QX)−1X′Q)y]/[m(T−1)−K]
σ^21=[y′P(I−Z(Z′PX)−1Z′P)y]/[m−K−1]
Z=(ιmTX)
Nerlove (1971) 접근 추정치 에서 여기서 는 고정 효과 회귀의 모형이며 은이 회귀의 잔차 제곱합 내에서 분모 가 것으로 추정됩니다 .σ2η∑mi=1(η^i−η^¯)2/(m−1)η^iσ^2ϵmT
나는 이것이 Randel의 계산에 의해 보여지는 것과 같이 큰 차이를 만든다는 것에 매우 놀랐습니다!
편집하다:
차이점에 관해서는 오류 구성 요소의 추정치가 plm
패키지 에서 검색 될 수 있으며 실제로 에 대한 포인트 추정치의 차이를 설명하는 매우 다른 결과를 반환합니다 (@Randel의 답변에 따라 시도하지 않은 오류가 발생합니다) 고치다):βamemiya
> ercomp(stackY~stackX, data = paneldata, method = "walhus")
var std.dev share
idiosyncratic 21.0726 4.5905 0.981
individual 0.4071 0.6380 0.019
theta: 0.06933
> ercomp(stackY~stackX, data = paneldata, method = "swar")
var std.dev share
idiosyncratic 0.6437 0.8023 0.229
individual 2.1732 1.4742 0.771
theta: 0.811
> ercomp(stackY~stackX, data = paneldata, method = "nerlove")
var std.dev share
idiosyncratic 0.5565 0.7460 0.002
individual 342.2514 18.5000 0.998
theta: 0.9857
나는 개별 구성 요소와 가 상관 되어있는 데이터를 사용하여 FE와 RE의 차이점을 보여 주려는 자매 스레드의 예제에서 오류 구성 요소의 추정치가 일관성이 없다고 생각 합니다. (실제로는 RE가 가중 평균 FE이고 오류 성분 추정치에 의해 결정된 가중치를 사용한 추정치 사이에 있다는 사실에 따라 궁극적으로 FE 추정치로부터 RE 추정치를 쫓아 낼 수 없기 때문에 RE가 아닐 경우 일관되게, 그것은 궁극적으로 이러한 추정치 때문입니다.)X
해당 예의 "불쾌감을주는"기능을 교체하면
alpha = runif(n,seq(0,step*n,by=step),seq(step,step*n+step,by=step))
간단히 말해
alpha = runif(n)
따라서 와 관련이없는 임의 효과는 대한 RE 포인트 추정값을 오류 구성 요소 추정의 모든 변형에 대해 실제 값 에 매우 가깝게 얻 습니다 .Xββ=−1
참고 문헌
Amemiya, T., 1971, 분산 성분 모형의 분산 추정 , International Economic Review 12, 1–13.
Baltagi, BH, 패널 데이터의 계량 분석, Wiley.
Nerlove, M., 1971a, 시계열 횡단면에서 역동적 인 경제 관계의 추정에 대한 추가 증거 , Econometrica 39, 359–382.
Swamy, PAVB 및 SS Arora, 1972, 오차 성분 회귀 모델에서 계수 추정기의 정확한 유한 표본 특성 , Econometrica 40, 261–275.
Wallace, TD 및 A. Hussain, 1969, 횡단 및 시계열 데이터 결합에 오류 구성 요소 모델 사용 , Econometrica 37, 55–72.