패널 데이터와 혼합 모델의 차이점


14

패널 데이터 분석과 혼합 모델 분석의 차이점을 알고 싶습니다. 내 지식으로는 패널 데이터와 혼합 모델 모두 고정 및 임의 효과를 사용합니다. 그렇다면 왜 서로 다른 이름을 가지고 있습니까? 아니면 동의어입니까?

고정, 랜덤 및 혼합 효과의 정의를 설명하는 다음 게시물을 읽었지만 내 질문에 정확하게 대답하지는 못합니다. 고정 효과, 임의 효과 및 혼합 효과 모델의 차이점은 무엇입니까?

누군가가 혼합 모델 분석에 대한 간략한 (약 200 페이지) 참조를 참조 할 수 있다면 감사 할 것입니다. 덧붙여서, 소프트웨어 처리에 상관없이 혼합 모델링 참조를 선호합니다. 혼합 모델링에 대한 이론적 설명.



답변:


22

패널 데이터와 혼합 효과 모델 데이터는 이중 인덱스 랜덤 변수 합니다. 첫 번째 지수는 그룹을위한 것이고, 두 번째 지수는 그룹 내 개인을위한 것입니다. 패널 데이터의 경우 두 번째 색인은 일반적으로 시간이며 시간이 지남에 따라 개인을 관찰한다고 가정합니다. 혼합 효과 모델의 시간이 두 번째 인덱스 인 경우 모델을 세로 모델이라고합니다. 혼합 효과 모델은 2 단계 회귀 분석 측면에서 가장 잘 이해됩니다. (설명 편의를 위해 하나의 설명 변수 만 가정)yij

1 차 회귀 분석은 다음과 같습니다

yij=αi+xijβi+εij.

이것은 단순히 각 그룹에 대한 개별 회귀로 설명됩니다. 두 번째 수준 회귀는 회귀 계수의 변동을 설명하려고 시도합니다.

αi=γ0+zi1γ1+ui
βi=δ0+zi2δ1+vi

두 번째 방정식을 첫 번째 방정식으로 대체하면

yij=γ0+zi1γ1+xijδ0+xijzi2δ1+ui+xijvi+εij

고정 효과는 고정 된 것으로, 이는 합니다. 무작위 효과는 및 입니다.γ0,γ1,δ0,δ1uivi

이제 패널 데이터의 경우 용어가 변경되지만 여전히 공통점을 찾을 수 있습니다. 패널 데이터 랜덤 효과 모델은 혼합 효과 모델과 동일합니다.

αi=γ0+ui
βi=δ0

모델이되는

yit=γ0+xitδ0+ui+εit,

여기서 는 임의의 효과입니다.ui

혼합 효과 모델과 패널 데이터 모델의 가장 중요한 차이점은 회귀 처리입니다 . 혼합 효과 모델의 경우 이들은 비 랜덤 변수 인 반면 패널 데이터 모델의 경우 항상 랜덤 인 것으로 가정합니다. 이것은 패널 데이터에 대해 고정 효과 모델이 무엇인지 명시 할 때 중요합니다.xij

혼합 효과 모델의 경우 임의 효과 있다고 가정 및 무관 도에서 과 때 항상 사실이다 와 고정됩니다. 확률 론적 허용한다면 이것이 중요해집니다. 따라서 패널 데이터의 랜덤 효과 모델은 이 와 상관 관계가 없다고 가정합니다 . 그러나 같은 형식의 고정 효과 모델uiviεijxijzixijzixijxitui

yit=γ0+xitδ0+ui+εit,

xituiδ0

yity¯i.=(xitx¯i.)δ0+εitε¯i.,

회귀 문제 발생시 간단한 OLS를 사용합니다. 대수적으로 이것은 최소 제곱 더미 변수 회귀 문제와 일치합니다. 여기서 는 고정 매개 변수 라고 가정합니다 . 따라서 이름 고정 효과 모델.ui

패널 데이터 계량 경제학에는 고정 효과와 임의 효과 용어 뒤에 많은 역사가 있습니다. 개인적으로이 모델들은 Wooldridge의 " 단면 및 패널 데이터의 계량 분석 "에 가장 잘 설명되어 있습니다. 내가 아는 한 혼합 효과 모델에는 그러한 이력이 없지만 다른 한편으로는 계량 경제학 배경에서 비롯된 것이므로 착각 할 수 있습니다.


...+xijvi+ui+εij

이 설명은 훌륭합니다! 그런 훌륭한 설명을 해주신 모든 노력에 진심으로 감사드립니다. 2 단계 회귀의 의미는 무엇입니까?
Beta

2
@Ari, 두 번째 수준 회귀는 첫 번째 수준 회귀의 회귀 계수에 대한 회귀입니다. 첫 번째 수준 회귀 분석은 그룹 내 변동을 설명하려고하는 반면 두 번째 수준 회귀 분석은 그룹 간의 변동을 설명하려고합니다. 이 부서는 인위적이지만 적어도 자연스럽게 느껴지기 때문에 좋아합니다. 이 유형의 구분은 계층 적 베이 즈 모델에도 사용됩니다.
mpiktas

δ0

3

소프트웨어 패키지를 참조하지 않고 혼합 모델링 이론을 설명하는 텍스트를 찾고 있음을 이해합니다.

Tom Snijders와 Roel Bosker의 약 250pp의 기본 및 고급 다중 레벨 모델링대한 소개 인 Multilevel Analysis를 권장 합니다. 마지막에는 소프트웨어에 관한 장이 있지만 (현재 다소 구식입니다) 나머지는 매우 접근하기 쉬운 이론입니다.

그래도 Sophia Rabe-Hesketh와 Anders Skrondal의 Stata를 사용한 다중 레벨 및 종 모델에 대한 위의 권장 사항에 동의해야합니다. 이 책은 매우 이론적이며 소프트웨어 구성 요소는 실질적인 텍스트에 대한 훌륭한 추가 사항입니다. 나는 보통 Stata를 사용하지 않고 책상 위에 텍스트를 놓고 매우 잘 쓰여졌습니다. 그러나 200pp보다 훨씬 깁니다.

다음 텍스트는 모두 해당 분야의 현재 전문가가 작성했으며 이러한 기술에 대한 자세한 정보를 원하는 사용자에게 유용합니다 (요청이 구체적으로 맞지 않더라도). 죄송합니다.]

Hoox, Joop (2010). 다단계 분석, 기술 및 응용 프로그램.

Gelman, A. 및 Hill, J. (2006) 회귀 및 다단계 / 계층 모델을 사용한 데이터 분석.

Singer, J. (2003) 적용 종 방향 데이터 분석 : 모델링 변경 및 이벤트 발생

Raudenbush, SW 및 Bryk, A., S. (2002). 계층 적 선형 모델 : 응용 프로그램 및 데이터 분석 방법

Luke, Douglas, (2004). 다단계 모델링

또한 R 텍스트뿐만 아니라 위에서 언급 한 두 번째 Wooldridge의 텍스트와 B ristol University of Multilevel Modeling Center 에는 많은 튜토리얼과 정보가 있습니다.


Playitagain에게 감사합니다! 이것은 매우 유용한 정보입니다. 당신의 이름조차 흥미 롭습니다 :)
Beta

2

나 또한 최근 에이 주제에 대한 참조 를 발견 한 것 사이의 차이점에 대해 궁금해했다. "패널 데이터" 는 "단면적 또는 주어진 시간 범위 ". 따라서 "패널"은 데이터 세트 내의 그룹 구조이며, 이러한 그룹에 이러한 유형의 데이터를 분석하는 가장 자연스러운 방법은 혼합 모델링 방식을 사용하는 것입니다.

혼합 효과 모델링에 대한 좋은 참고 자료 (당신이 R을 말하는지에 관계없이)는 Douglas Bates ( lme4 : R을 사용한 혼합 효과 모델링 )의 다음 책 초안 입니다 .


1
참조 주셔서 감사합니다! 그러나 문제는 여전히 남아 있습니다.
Beta


1

Stata를 사용하는 경우 Sophia Rabe-Hesketh와 Anders Skrondal의 Stata사용한 다단계 및 종 모델을 사용 하는 것이 좋습니다. 정확히 당신이 관심있는 것에 따라, 200 페이지가 맞을 수도 있습니다.


참조 주셔서 감사합니다 Dimitriy. 그러나 불행히도 나는 STATA를 사용하지 않습니다. 나는 주로 SAS를 사용하고 때로는 R을 사용합니다. 그러나 어쨌든 감사합니다.
Beta

2
wiley.com/WileyCDA/WileyTitle/productCd-0470073713.html에 대해 좋은 소식을 들었지만 직접 읽지는 않았습니다.
Dimitriy V. Masterov

고마워 Dimitriy! 이것은 유망한 것으로 보입니다. 고글보다는 질문을하는 것의 장점은 정말 좋은 결과를 얻을 수 있다는 것입니다. :)
Beta

1

내 경험상 '패널 계량 경제학'을 사용하는 근거는 패널 '고정 효과'추정기가 다양한 형태의 생략 된 가변 바이어스를 제어하는 ​​데 사용될 수 있다는 것입니다.

그러나, Mundlak 타입 접근법을 사용하여 , 즉 그룹 수단을 여분의 회귀 자로 포함 하는 멀티 레벨 모델 내에서 이러한 타입의 추정을 수행하는 것이 가능하다 . 이 접근법은 오차항과 잠재적 인 그룹 수준 생략 된 요인 간의 상관 관계를 제거하여 '군내'계수를 나타냅니다. 그러나 나에게 알려지지 않은 이유로 이것은 일반적으로 응용 연구에서 수행되지 않습니다. 이 슬라이드 와이 문서 는 설명을 제공합니다.


(+1) 사회학자는 종종 그룹의 의미를 상황에 따른 영향으로 해석합니다 (이것은 시계열 패널 데이터보다 중첩 된 단면 데이터에 대한 것이 더 많지만). 관련 참고 사항 Manski (1993) ( PDF here )에 이러한 문맥 상 영향이 자주 식별되지 않는 방법을 보여주는 기사가 있습니다. "이것이 끝나지 않은 이유"때문에 나는 그것이 사회 과학 실천의 차이만큼이나 다른 것으로 생각된다. 그것은 좋은 질문이다.
Andy W
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.