제로 팽창 된 포아송 회귀


14

가정 독립적이며Y=(Y1,,Yn)

Yi=0with probability pi+(1pi)eλiYi=kwith probability (1pi)eλiλik/k!

또한 가정 파라미터 P = ( P 1 , ... , P는 N을 ) 충족λ=(λ1,,λn)p=(p1,,pn)

log(λ)=Bβlogit(p)=log(p/(1p))=Gλ.

같은 공변량이 영향을 미치는 경우 페이지를 수 있도록 B = G , 왜 제로는 포아송 회귀 포아송 회귀 많은 매개 변수로 두 번 필요로 팽창 하는가?λpB=G


2
여전히 λ 를 추정해야합니다 . BG 는 설계 행렬 (데이터)이므로 같으면 매개 변수 공간의 크기가 줄어들지 않습니다. βλBG
매크로

@ 매크로 : 가 1의 열인 경우 , 왜 포아송 회귀보다 더 많은 모수를 추정해야합니까? G
Damien

잘 당신은 (모델의 로지스틱 부분의 "절편")과 λ i (모델의 포아송 부분의 "절편" ) 을 추정해야합니다. 그래서 1 대신 2 개의 매개 변수가 있습니다.piλi
Macro

1
@Robby, 제약 조건을 만들어야하는 매개 변수 수를 줄이려면 예를 들어, , 특히 링크 기능이 다르기 때문에 이것이 의미가 있다고 생각할 이유는 없습니다. λ=β
매크로

3
@MichaelChernick-Poisson과 마찬가지로 0이 아닌 값을 보는 것과 동일한 상대 확률을 유지하면서 기본적으로 Poisson dist'n에서 0을 볼 확률을 "팽창"시키기 때문에 zero-inflated Poisson이라고합니다.
jbowman

답변:


2

제로 팽창 된 포아송의 경우, 이면 βλ는 모두 같은 길이, 즉 B 또는 G 의 열 수입니다 . 따라서 매개 변수의 수는 설계 행렬의 열 수의 두 배입니다. 즉 인터셉트 (및 더미 코딩이 필요한 모든 것을 포함)를 포함하는 설명 변수의 수의 두 배입니다.B=GβλBG

직선형 포아송 회귀에서는 걱정할 벡터 가 없으며 λ 를 추정 할 필요가 없습니다 . 따라서 매개 변수의 수는 단지 β 의 길이, 즉 제로 팽창 된 경우의 매개 변수 수의 절반입니다.pλβ

이제 G 와 같은 특별한 이유 는 없지만 일반적으로 의미가 있습니다. 그러나 하나의 프로세스 G λ에 의해 이벤트가 발생할 확률이 생성되고 완전히 다른 프로세스 B β 가 0이 아닌 이벤트가 주어지면 얼마나 많은 이벤트가 발생 하는지를 나타내는 데이터 생성 프로세스를 상상할 수 있습니다. 예를 들어, 나는 역사 시험 점수를 기반으로 교실을 선택하여 관련없는 게임을 한 다음 점수 목표를 관찰합니다. 이 경우 BG와 상당히 다를 수 있습니다 (히스토리 시험 점수를내는 것이 게임의 주행 성능과 다른 경우) 및 βλBGGλBβBGβλ길이가 다를 수 있습니다. B 보다 많은 열을 가질 수 있습니다 . 따라서이 경우 제로 팽창 된 포아송 모델은 단순한 포아송 모델보다 더 많은 매개 변수를 갖습니다.GB

일반적으로 라고 생각 합니다.G=B

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.