Mundlak 고정 효과 절차는 인형과 함께 로지스틱 회귀에 적용 할 수 있습니까?


12

8000 개의 클러스터와 4 백만 개의 관측치가있는 데이터 세트가 있습니다. 불행히도 내 통계 소프트웨어 Stata는 로지스틱 회귀 분석에 패널 데이터 기능을 사용할 때 다소 느리게 실행됩니다 xtlogit.

그러나 비 패널 logit기능을 사용하면 결과가 훨씬 빨리 나타납니다. 따라서 logit고정 효과를 설명하는 수정 된 데이터를 사용하면 이점을 얻을 수 있습니다 .

나는이 절차가 "Mundlak 고정 효과 절차"(Mundlak, Y. 1978. 시계열 및 횡단면 데이터 풀링 Econometrica, 46 (1), 69-85)로 만들어 졌다고 생각한다.

Antonakis, J., Bendahan, S., Jacquart, P., & Lalive, R. (2010) 의 논문에서이 절차에 대한 직관적 인 설명을 찾았습니다 . 인과 관계 주장에 대한 검토 : 권고 및 권고. 분기 별 리더십, 21 (6). 1086-1120. 나는 인용한다 :

생략 된 고정 효과의 문제를 해결하고 여전히 수준 2 변수를 포함하는 한 가지 방법은 추정 된 모델에 모든 수준 1 공변량의 군집 평균을 포함시키는 것입니다 (Mundlak, 1978). 군집 평균은 회귀 변수로 포함되거나 수준 1 공변량에서 공제됩니다 (즉, 군집 평균 중심화). 군집 평균은 군집 내에서 변하지 않으며 (군집마다 다름) 수정 된 효과가 포함 된 것처럼 수준 1 매개 변수의 일관된 추정을 허용합니다 (Rabe-Hesketh & Skrondal, 2008 참조).

따라서 클러스터 평균 센터링은 내 계산 문제를 해결하는 데 이상적이고 실용적입니다. 그러나이 논문들은 선형 회귀 (OLS)를 지향하는 것으로 보인다.

이 군집 평균 중심화 방법은 고정 효과 이항 로지스틱 회귀의 "복제"에도 적용 가능합니까?

동일한 대답을 가져야하는보다 기술적 인 질문은 다음 xtlogit depvar indepvars, fe과 같습니다. logit depvar indepvars데이터 집합 B가 클러스터 평균 중심 버전의 데이터 집합 A 인 경우 데이터 집합 A가 데이터 집합 B와 동일 합니까?

이 클러스터 평균 센터링에서 발견 된 추가 어려움은 인형에 대처하는 방법입니다. 인형은 0 또는 1이므로 랜덤 및 고정 효과 회귀 분석에서 동일합니까? 그들은 "중심"해서는 안됩니까?

답변:


9

비선형 모델의 경우 이러한 트릭으로 인해 관찰되지 않은 고정 효과가 제거되지 않기 때문에 로짓과 같은 모델에서는 먼저 차이 또는 변형 (demeaning)과 같은 변형을 사용할 수 없습니다. 고정 효과를 직접 추정하기 위해 N-1 개의 개별 인형을 포함하는 것이 가능한 더 작은 데이터 세트가 있더라도 데이터의 시간 차원이 크지 않으면 편향된 추정치가 발생할 수 있습니다. 따라서 패널 로짓에서 고정 효과를 제거하는 것은 차이점이나 의미를 따르지 않으며 로짓 기능 형태로만 가능합니다. 당신이 세부 사항에 관심이 있다면 당신이 봐 가질 수 노트 PDF 페이지 30 Söderbom하여 (/ 품위를 떨어 뜨리는 첫번째 로짓에 차이점 이유에 대한 설명을 / 프로 빗이 도움이되지 않습니다) 및 42 페이지 (패널 로짓 추정의 도입).

또 다른 문제는 xtlogit일반적으로 패널 로짓 모델은 한계 효과를 계산하는 데 필요한 고정 효과를 직접 추정하지 않는다는 것입니다. 그것들이 없으면 몇 시간과 몇 시간 동안 모델을 실행 한 후에 실망 스러울 수있는 계수를 해석하는 것이 매우 어색합니다.

이러한 대규모 데이터 세트와 앞에서 언급 한 FE 패널 로짓의 개념상의 어려움으로 선형 확률 ​​모델을 고수했습니다. 나는이 답변이 당신을 실망시키지 않기를 희망하지만 그러한 조언을 제공하는 많은 이유가 있습니다. 비선형 모델의 계수 변경!), 고정 효과를 쉽게 제어 할 수 있으며 이유를 넘어서서 추정 시간을 늘리지 않고도 자기 상관 및 군집에 대한 표준 오류를 조정할 수 있습니다. 이게 도움이 되길 바란다.


1
해결책은 아니지만 답입니다. 감사합니다 :)
Tom

1
작은 점 : p20은 이러한 슬라이드를 보여 주지만 Mundlak 수정 (일명 '상관 된 임의 효과'모델)은 p47에 설명되어 있으며 이러한 경고는 없습니다.
conjugateprior

1

조건부 로짓 (Stata의 "clogit")은 대체 고정 효과 로짓 패널 추정기입니다.

http://www3.nd.edu/~rwilliam/stats3/Panel03-FixedEffects.pdf


5
사이트에 오신 것을 환영합니다! 나는 이것이 질문의 속도를 높이기 위해 수정 된 단면 로지스틱 회귀에 의한 조건부 (고정 효과) 로지스틱 회귀를 피하는 방법이기 때문에 이것이 받아 들일만한 대답이라고 생각하지 않습니다. 귀하의 참고 자료 (3 페이지 상단)에서 알 수 있듯이 "우리는 고정 효과 로짓 분석을 수행하기 위해 Stataclogit명령 또는 xtlogit, fe명령을 사용할 수 있습니다 . 둘 다 동일한 결과를 제공 xtlogit, fe합니다 clogit. OP는 이미 xtlogit, fe두 번째 단락을 기반으로 알고있었습니다 .
Randel

0

Allison은 Allison, (2009), "Fixed effects regression models", p.32f에서이 문제에 대해 논의했습니다.

Allison은 최대 가능성을 가진 무조건 모델을 추정 할 수 없다고 주장합니다. 이것은 "부수적 인 매개 변수 문제"로 인해 모델이 바이어스되기 때문입니다. 대신 조건부 로짓 모형을 사용하는 것이 좋습니다 (Chamberlain, 1980). 이것은 각 개인에 대해 관찰 된 사건의 수에 대한 우도 기능을 조절함으로써 달성됩니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.