나는 주로 첫 세 질문에 중점을 둘 것입니다. 짧은 대답은 다음과 같습니다. (1) 각 기간 동안 DV에 대한 IV의 효과를 비교해야하지만 (2) 크기 만 비교하면 잘못된 결론을 초래할 수 있으며 (3) 여러 가지 방법이 있지만 어느 것이 맞는지에 대한 합의가 없습니다.
아래에서는 왜 단순히 계수 크기를 비교할 수없고 지금까지 생각한 솔루션을 가리킬 수 없는지 설명합니다.
Allison (1999)에 따르면 OLS와 달리 로지스틱 회귀 계수는 이러한 이질성이 관심 변수와 관련이없는 경우에도 관찰되지 않은 이질성의 영향을받습니다.
로지스틱 회귀 분석에 적합 할 때 :
(1)
ln(11−pi)=β0+β1x1i
실제로 이항 종속 변수 의 값 을 가정하기 위해 각 관측치의 기본 경향을 나타내는 잠재 변수 의 값을 예측하는 방정식을 피팅하는 중입니다. 가 특정 임계 값을 초과 하면 어떻게됩니까 ? 이에 대한 방정식은 (Williams, 2009)입니다. 1 y ∗y∗1y∗
(2)
y∗=α0+α1x1i+σε
이라는 용어 는 다른 용어와 독립적이며 로지스틱 분포 또는 프로 빗 및 로지스틱 분포의 경우 정규 분포를 따르는 것으로 가정합니다. 카우치.ε
Williams (2009)에 따르면 방정식 2 의 계수는 다음을 통해 방정식 1 의 계수 와 관련이 있습니다 .βαβ
(3)
βj=αjσj=1,...,J.
방정식 2와 3에서 는 관찰되지 않은 변동의 스케일링 계수이며 추정 된 계수 의 크기는 의존 하지만 관찰되지는 않습니다. 이를 바탕으로 앨리슨 (1999), 윌리엄스 (2009) 및 무드 (2009)는 다른 그룹, 국가 또는 기간에 대해 추정 된 로지스틱 모델 간의 계수를 순진하게 비교할 수 없다고 주장합니다.β σσβσ
관찰되지 않은 변동이 그룹, 국가 또는 기간에 따라 다르면 비교가 잘못된 결론을 도출 할 수 있기 때문입니다. 다른 모델을 사용하고 동일한 모델 내에서 교호 작용 항을 사용하는 비교는이 문제로 인해 어려움을 겪습니다. 로짓 외에, 이것은 또한 사촌 프로 빗, 클로 로그, 카우치 및 확장에 의해 이러한 링크 함수를 사용하여 추정 된 이산 시간 위험 모델에도 적용됩니다. 정렬 된 로짓 모델도 영향을받습니다.
Williams (2009)는이 솔루션이 이종 선택 모델 (일명 위치 척도 모델)을 통해 관찰되지 않은 변동을 모델링하고이를 oglm
위한 Stata 추가 기능을 제공 한다고 주장합니다 (Williams 2010). R에서 이기종 선택 모델은 CRAN을 통해 사용 가능한 패키지 hetglm()
기능에 적합 할 수 있습니다 glmx
. 두 프로그램 모두 사용하기가 매우 쉽습니다. 마지막으로 Williams (2009)는 PLUM
이러한 모델에 적합하도록 SPSS의 루틴을 언급 했지만이 모델을 사용한 적이 없으며 사용이 얼마나 쉬운 지 언급 할 수 없습니다.
그러나 분산 방정식이 잘못 지정되었거나 측정 오류가있는 경우 이기종 선택 모델을 사용한 비교가 훨씬 더 치우칠 수 있음을 보여주는 작업 문서가 하나 이상 있습니다.
Mood (2010)에는 분산 모델링과 관련이 없지만 예측 된 확률 변화의 비교를 사용하는 다른 솔루션이 나열되어 있습니다.
분명히 그것은 해결되지 않은 문제이며 종종 내 분야 회의 (사회)에서 다른 해결책을 제시하는 논문을 보게됩니다. 해당 분야의 사람들이 무엇을하는지 살펴보고 그에 대처하는 방법을 결정하도록 권합니다.
참고 문헌
- 앨리슨, PD (1999). 그룹 간 로짓 및 프로 비트 계수 비교. 사회 학적 방법 및 연구, 28 (2), 186–208.
- 기분, C. (2010). 로지스틱 회귀 : 우리가 할 수 있다고 생각하는 것과 할 수없는 것, 그리고 우리가 할 수있는 일. 유럽 사회 학적 검토, 26 (1), 67–82.
- 윌리엄스, R. (2009). 이기종 선택 모델을 사용하여 그룹 간 로짓 및 프로 비트 계수 비교 사회 학적 방법 및 연구, 37 (4), 531-559.
- 윌리엄스, R. (2010). oglm과 함께 이기종 선택 모델 맞추기 Stata Journal, 10 (4), 540–567.