카운트 데이터와 함께 사용할 모델을 결정하기위한 적절한 전략은 무엇입니까? 나는 다중 레벨 모델로 모델링 해야하는 데이터를 계산 했으며이 사이트에서 버그 또는 MCMCglmm을 통해 가장 좋은 방법이라고 제안했습니다. 그러나 나는 여전히 베이지안 통계에 대해 배우려고 노력하고 있으며, 먼저 데이터를 일반 선형 모델로 맞추고 데이터의 중첩 구조를 무시해야한다고 생각했습니다 (그러므로 기대할 내용에 대한 모호한 아이디어를 얻을 수 있습니다).
데이터의 약 70 %는 0이고 평균에 대한 분산의 비율은 33입니다. 따라서 데이터가 과도하게 분산되어 있습니다.
(포아송, 음 이항, 준 및 0 팽창 모델을 포함하여) 여러 가지 다른 옵션을 시도한 후 결과의 일관성이 거의 없습니다 (모든 것이 중요하지 않은 것이 중요하지 않음).
인플레이션과 과대 산포에 근거하여 어떤 모델을 선택해야하는지에 대한 정보에 입각 한 결정을 내릴 수 있습니까? 예를 들어, 준-포아송이 음의 이항 법보다 더 적절하다는 것을 어떻게 유추 할 수 있습니까? 마찬가지로, 0 팽창 모델을 사용하는 경우 더 이상 과분 산이 없는지 어떻게 평가합니까? 또는 제로 팽창 된 포아송과 제로 팽창 된 음의 이항을 어떻게 결정해야합니까?