카운트 데이터 분산의 파라 메트릭 모델링


12

일부 데이터를 모델링하려고하는데 어떤 유형의 모델을 사용할 수 있는지 잘 모르겠습니다. 카운트 데이터가 있고 데이터의 평균과 분산 모두에 대한 모수 추정치를 제공하는 모델을 원합니다. 즉, 다양한 예측 요소가 있으며 그룹 평균뿐만 아니라 분산에 영향을 미치는지 확인하고 싶습니다.

분산이 평균과 같기 때문에 포아송 회귀가 작동하지 않는다는 것을 알고 있습니다. 이 가정은 내 경우에는 유효하지 않으므로 과대 산포가 있음을 알고 있습니다. 그러나 음 이항 모델은 모형의 예측 변수가 아닌 단일과 분산 모수 만 생성합니다. 어떤 모델이 가능합니까?

또한, 모델 및 / 또는 모델을 구현하는 R 패키지를 논의하는 서적 또는 논문에 대한 참조가 인정 될 것이다.


1
포아송 회귀 분석을하지 않고 과대 산포가 있음을 어떻게 알 수 있습니까? 결국 원시 (응답) 값 의 분산을 평균 과 비교하는 것은 관련이 없습니다. 포아송 모델의 적합도는 중요합니다 (이것은 평가와 비교하여 선형 모델의 잔차 분포를 평가하는 아날로그입니다) 응답 변수의 분포). 이것을 넣는 또 다른 방법은 독립 변수와 반응 사이의 연결이 아름답고 정확한 포아송 모델에서도과 분산의 모양을 만들 수 있다는 것입니다.
whuber

2
@ whuber 그것은 좋은 지적입니다. 하위 그룹의 분산과 평균을 조사하는 단일 범주 형 예측 변수의 경우과 분산을 탐지하기에 충분하지만 다변량 포아송 회귀의 경우에는 그렇지 않습니다. 논쟁을 위해, 포아송과 음의 양생 회귀가 모두 수행되었고 음의 이항이 anova 모델 비교를 통해 더 잘 맞는다고 가정합시다. 과대 산포를 나타냅니다. 그렇다면 분산 / 과대 분산은 어떻게 상수가 아닌 파라 메트릭 방식으로 모델링 될 수 있습니까?
Brian Diggs

1
McCullagh와 Nelder에는 Generalized linear models 2nd edition 이라는 장이 있지만 (사본은 작동 중입니다 ...) 실제 가능성은 없지만 준 가능성을 사용할 수 있습니다. 장의 제목 일 수 있습니다. 해당 확률 모델이 없더라도 반복적으로 가중 된 최소 제곱을 적용합니다.
Karl

McCullagh와 Nelder의 10 장에서는 평균과 분산의 모수를 매개 변수화하는 평균 및 분산의 공동 모델링에 대해 설명합니다. 확장 된 유사 가능성이 주요 도구이지만 일부 상황에서는 해당 방법에 대한 우려
손님

답변:


9

R의 gamlss 패키지를 사용하여 음의 이항 분산 매개 변수 자체를 변수 및 매개 변수의 함수로 모델링 할 수 있습니다. 소개에서 발췌 한 내용을 제공합니다.

GAMLSS를 사용해야하는 이유

반응 변수가 개수 (개별) 데이터 인 경우 포아송 분포가 적합하지 않을 가능성이 큽니다. GAMLSS는 시도 할 수있는 다양한 이산 분포 (음수 이항 포함)를 제공합니다. 분산 변수는 설명 변수의 함수로 모델링 할 수도 있습니다.

www.gamlss.org 웹 사이트에는 패키지에 사용 된 접근 방식에 대한 문서 및 여러 문서에 대한 링크가 있습니다.


두 답변 모두 도움이되고 좋은 참고 자료를 제공합니다. 나는 (a) 다른 4 분 앞서서 (b) gamlss 솔루션이 나에게 새로운 것이기 때문에이 현상금을 수여하고 있습니다 (nbreg에 익숙합니다). 그러나 좋은 답변을 제공하기 위해 @timbp를 싫어합니다. 우리 사이트에 계속 기여하기를 바랍니다.
whuber

2
@ whuber, 나는 둘 다 매우 도움이 되었기 때문에 "the"답변으로 받아 들일 부분이 찢어졌습니다. 내가 사용할 수있는 R 패키지 참조가 포함되어 있기 때문에 이것과 함께 갔다. 다른 답변의 책 참조는 잘 읽었으며 할인해서는 안됩니다. 이 두 가지 좋은 답변을 얻은 현상금을 제공해 주셔서 감사합니다.
Brian Diggs

9

Stata는 -gnbreg- 명령을 제공하여 분산 매개 변수를 모델링 할 수 있습니다. http://www.stata.com/help.cgi?nbreg 에서 명령에 대한 Stata 도움말을 볼 수 있습니다 .

Stata는 이것을 일반화 된 음 이항 모델이라고 부릅니다. 조셉 힐베 (Joseph Hilbe)는 그의 책 "음수 이항 회귀", 10.4 절에서 "NB-H : 이종 음성 이항 회귀"라고 설명합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.