잘린 포아송과 기본 포아송이 중첩되거나 중첩되지 않습니까?


9

기본 포아송 회귀가 0으로 부풀린 포아송 회귀의 중첩 버전인지 여부를 논의하는 많은 것을 보았습니다. 예를 들어, 이 사이트 는 후자가 추가 0을 모델링하기위한 추가 매개 변수를 포함하지만 이전 페이지와 동일한 포아송 회귀 매개 변수를 포함하지만 페이지에는 동의하지 않는 참조가 포함되어 있기 때문에이 사이트 는 주장합니다.

내가 찾을 수없는 것은 제로 자른 포아송과 기본 포아송이 중첩되어 있는지 여부입니다. 제로 잘린 포아송이 제로 카운트 확률이 0이라는 추가 규정이있는 포아송이라면, 나는 그것이 될 수있는 것처럼 들리지만 더 확실한 대답을 기대하고있었습니다.

내가 궁금해하는 이유는 Vuong의 테스트 (중첩되지 않은 모델의 경우) 또는 로그 우도의 차이 (중첩 모델의 경우)를 기반으로보다 기본적인 카이 제곱 테스트를 사용 해야하는지에 영향을 미치기 때문입니다.

Wilson (2015) 은 Vuong 테스트가 0으로 평평한 회귀 분석과 기본 회귀 분석을 비교하기에 적합한 지에 대해 이야기하지만 잘리지 않는 데이터에 대해 논의하는 소스를 찾을 수 없습니다.

답변:


4

지금이 문제를 해결하십시오. 혼동을 피하기 위해 원래 질문에서 언급 된 Wilson of Wilson (2015)입니다 .Poisson 및 잘린 Poisson 모델이 중첩, 비 중첩 등인지 묻습니다. 약간 단순화하면 작은 모델은 큰 모델에 중첩됩니다. 매개 변수의 서브 세트가 명시된 값으로 고정 된 경우 모델은 더 작은 것으로 줄어 듭니다. 두 매개 변수가 각 매개 변수의 서브 세트가 특정 값으로 고정 될 때 동일한 모델로 축소되는 경우 중첩됩니다. 이 정의에 따르면, 잘린 포아송과 표준 포아송은 중첩되지 않습니다. 그러나 이것은 많은 사람들이 간과 한 것으로 보인다. Vuong의 분포 이론은 엄격하게 중첩되고 엄격하게 중첩되지 않은 과도하게 겹칩니다. 중첩 등의 기본 정의에 6 가지 제한을 추가하는 것을 의미하는 "강력하게"이러한 제한은 정확히 단순하지는 않지만, 무엇보다도 로그 우도 비율 분포에 대한 Vuong의 결과가 적용되지 않는 경우에는 적용 할 수 없음을 의미합니다. 모델 / 분포는 매개 변수 공간의 경계에 중첩됩니다 (0- 인플레이션 매개 변수에 대한 ID 링크가있는 Poisson / 0 팽창 Poisson의 경우와 같이). 또는 매개 변수가 무한대 인 경향이있을 때 한 모델이 다른 모델에 경향이있는 경우 로짓 링크를 사용하여 0- 인플레이션 매개 변수를 모델링 할 때 Poisson / zero-inflated Poisson의 경우입니다. Vuong은 이러한 상황에서 로그 우도 비율 분포에 대한 이론을 제시하지 않습니다. 불행히도 여기서

다음 R 코드는 포아송 분포와 잘린 포아송 로그 우도 비율의 분포를 시뮬레이션합니다. VGAM패키지 가 필요합니다 .

n<-30   
lambda1<-1
H<-rep(999,10000)
for(i in 1:10000){
  print(i)
  y<-rpospois(n, lambda1)
  fit1 <- vglm(y ~ 1, pospoisson)
  fit2<-glm(y~1, family=poisson(link="log"))
  H[i]<-logLik(fit1)-logLik(fit2)
}

hist(H,col="lemonchiffon")

4

기본 포아송은보다 일반적인 형태로 중첩 된 것으로 생각할 수 있습니다.

(엑스)=(1)이자형λλ엑스엑스!+1(엑스=0)

언제 =0기본 포아송이 있습니다. 언제=특급{λ}/(1특급{λ}), 포아송이 0으로 잘립니다. 언제특급{λ}/(1특급{λ})<<0, 우리는 Poisson을 0으로 줄였습니다. 언제0<<1우리는 0으로 부풀린 포아송을 가지고 있고 =1.

따라서 중첩 된 버전의 Vuong 테스트 또는 제안 된 카이 제곱이 귀하의 경우에 적합한 것으로 보입니다. 그러나 카이-제곱은 "큰"의 작은 확률로 인해 문제가 발생할 수 있습니다 (λ) 관찰. 데이터가 많지 않은 한 무증상에 의존하는 대신 부트 스트랩을 사용하여 카이 제곱 통계량의 p- 값을 얻는 것이 좋습니다.


감사합니다 @jbowman-내가 기대했던 더 엄격한 답변입니다. 그래도 확실하지 않습니다. Vuong 테스트의 핵심은 중첩되지 않은 모델에 대한 것이라고 생각했기 때문에 원래 게시물을 넘어서도 "Vuong 테스트의 중첩 된 버전"에 대한 정보를 조금 더 제공 할 수 있습니까? 혼동의 원인을 분명히하기 위해 :이 순간까지는 R의 vuong패키지 기능을 알고 pscl있었는데 이는 중첩되지 않은 모델을위한 것입니다. 방금 googled하고 인수 'nested'를 포함하는 vuongtest패키지 에서 함수 를 찾았습니다 nonnest2. 그게 다야?
저스틴

네 그렇습니다. 실제로 Vuong 테스트 의 Wikipedia 페이지 en.wikipedia.org/wiki/Vuong%27s_closeness_test 는 차이점을 설명하는 데 약간 도움이됩니다 (종종별로 많지는 않습니다).
jbowman

1
NB 포아송 및 제로립니다 포아송 당신이 정의한 분포의 특별한 경우이다. 하나는 다른 하나에 중첩되어 있지 않습니다. 따라서 Wilks의 정리를 사용하여 로그 우도 비율의 두 배인 점근 가설 제곱 분포를 도출 할 수는 없습니다. (Vuong 테스트에도 규칙적인 조건이 있다고 생각합니다.)
Scortchi-Monica Monica

3
@Scortchi 나는 당신이 적용하는 "중첩"의 정의에 대해 궁금합니다. 나는 당신의 결론에 동의하지 않지만, 약간 다른 관점에서 결론을 얻습니다. 그렇습니다.=0)에 대한 MLE 모수 추정치의 점근 분포에 대한 다양한 결론 이 값은 적용되지 않습니다 가족 의 경계놓여 있습니다 . 중요한 차이점이 없습니까?
whuber

2
@ whuber, 나는 같은 요점에 대한 답변을 논평 / 제공하려고했습니다. 참조 된 링크 는 다음과 같이 언급합니다 : "... 제곱 분포가 매개 변수 공간의 경계에 있기 때문에 카이-제곱 분포를 조정해야 할 수도 있지만"
Ben Bolker
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.