카운트 데이터에 대한 회귀 모델 비교


11

최근에 동일한 예측 변수 / 응답 데이터에 대해 4 개의 다중 회귀 모델에 적합했습니다. 포아송 회귀 분석에 적합한 두 가지 모형.

model.pois <- glm(Response ~ P1 + P2 +...+ P5, family=poisson(), ...)
model.pois.inter <- glm(Response ~ (P1 + P2 +...+ P5)^2, family=poisson(), ...)

부정적인 이항 회귀 분석에 적합한 두 가지 모형.

library(MASS)
model.nb <- glm.nb(Response ~ P1 + P2 +...+ P5, ...)
model.nb.inter <- glm.nb(Response ~ (P1 + P2 +...+ P5)^2, ...)

이 모델들을 비교하기 위해 사용할 수있는 통계 테스트가 있습니까? 나는 AIC를 적합의 척도로 사용했지만 AFAIK는 실제 테스트를 나타내지 않습니다.


통계 테스트를 사용하여 모형의 적합치 를 비교하고 싶 습니까? 어떤 종류의 가설을 테스트하고 싶습니까?
Firefeather

@Firefeather 예를 들어, 나는의 적합 여부를 테스트 할 것 model.nb.inter입니다 훨씬 더 나은보다 model.pois.inter. 그렇습니다. AIC는 더 낮지 만 얼마나 더 낮을수록 훨씬 더 좋 습니까?
Daniel Standage

참고 :이 질문에 대한 답변에는 실제로 AIC가 포함될 필요는 없습니다.
Daniel Standage

Fmodel.poismodel.pois.intermodel.nbmodel.nb.interF

1
@Firefeather, 예. 가족 단위의 신뢰 수준을 제어 할 필요성을 알고 있습니다. Bonferroni보다 Scheffe가 더 적합할까요?
Daniel Standage

답변:


14

우도 이항 모형을 우도 비율 검정을 사용하여 해당 포아송 모형과 비교할 수 있습니다. 푸 아송 모형은과 분산 모수가 0 인 음 이항 모형과 같습니다. 따라서 중첩 모형이며 가능성 비율이 유효합니다. 복잡한 문제는과 분산 파라미터가 음이 아닌 것으로 제한된다는 것입니다. 즉, 논리적으로 0보다 작을 수 없으므로 귀무 가설은 파라미터 공간의 경계에 있습니다. 즉, 로그 자유도를 두 배의 자유도를 가진 카이 제곱 분포와 비교하는 대신 1 df의 카이 제곱의 동일한 부분과 0의 점 질량으로 구성된 혼합 분포와 비교해야합니다. (자유도가 0 인 카이 제곱 분포). 실제로 의미하는 것은 1 df의 카이 제곱을 사용하여 p- 값을 계산 한 다음 절반으로 줄일 수 있다는 것입니다. 자세한 내용과 배경은 사례 5를 참조하십시오.Self & Liang JASA 1987; 82 : 605-610. .

Stata와 같은 일부 통계 소프트웨어 패키지는 음 이항 모델에 적합 할 때 자동으로이 모든 것을 수행합니다. 사실 나는 Stata 도움말 시스템에서 위의 많은 부분을 부끄러워하지 않았습니다 help j_chibar.


5

나는 이것을 anova()R이 사용할 수 있다고 믿는다 . 이름에도 불구하고 우도 비 검정입니다. The R Book의 Crawley 에는 사용법에 대한 예가 있습니다.


1

원 스톱 참고 사항으로, 모형이 중첩되어 있으므로 우도 비 검정을 수행 할 수 있습니다.

일반적으로 그것이 사실이 아니므로 중첩되지 않은 모델을 비교하려면 Vuong의 테스트를 사용할 수 있습니다 .

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.