카운트 데이터에 대해 가장 일반적으로 사용되고 설명되는 선택 분포 인 "기본"은 포아송 분포 입니다. 대부분 첫 번째 실제 사용법의 예를 사용하여 설명됩니다.
이 배포판의 실제 적용은 1898 년 Ladislaus Bortkiewicz가 말 차기로 우연히 죽인 프로이센 군대의 군인 수를 조사하는 임무를 받았을 때 이루어졌다. 이 실험은 Poisson 분포를 신뢰성 공학 분야에 도입했습니다.
λλ
이자형( Y| 엑스, β) = λ = exp( β0+ β1엑스1+ ⋯ + β케이엑스케이)
λ
실제 데이터에 포아송 분포를 사용할 때의 문제는 평균이 분산과 같다고 가정한다는 것입니다. 이 가정을 위반하는 것을 과대 산포 라고 합니다. 이러한 경우 항상 유사 Poisson 모델, Poisson이 아닌 로그 선형 모델 (대수 Poisson은 정규 분포로 근사 할 수 있음), 음 이항 회귀 (Poisson과 밀접한 관련이 있습니다. Berk and MacDonald, 2008 참조) 또는 Stephan Kolassa가 설명한 다른 모델 .
포아송 회귀에 대한 친근한 소개를 위해 Lavery (2010) 또는 Coxe, West and Aiken (2009)의 논문을 확인할 수도 있습니다.
Lavery, R. (2010). 애니메이션 가이드 : 포아송 회귀 소개 NESUG 종이, sa04.
Coxe, S., West, SG 및 Aiken, LS (2009). 카운트 데이터 분석 : 포아송 회귀 및 그 대안에 대한 간단한 소개. 성격 평가 저널, 91 (2), 121-136.
Berk, R., & MacDonald, JM (2008). 과대 산포 및 포아송 회귀 정량적 범죄학 저널, 24 (3), 269-284.