현재 다음 측정 값을 사용하는 일련의 행동 실험 데이터를 분석하고 있습니다. 이 실험의 참가자들은 다른 사람들이 일련의 10 개의 아나그램을 풀기 위해 사용할 수있는 실마리를 선택해야합니다. 참가자들은이 다른 사람들이 아나그램 해결 능력에 따라 돈을 벌거나 잃을 것이라고 믿게되었습니다. 단서는 그들이 얼마나 도움이되는지에 따라 다릅니다. 예를 들어, RUNNING의 아나그램 인 NUNGRIN 아나그램의 경우 다음과 같은 세 가지 단서가 있습니다.
- 빨리 움직이기 (도움이되지 않는)
- 마라톤 경주에서하는 일 (유용)
- 항상 건강한 취미는 아닙니다 (도움이되지 않음)
측정 값을 구성하기 위해 참가자가 다른 사람에게 도움이되지 않는 단서를 선택하는 횟수 (10 개 중)를 계산합니다. 실험에서 저는 사람들이 선택한 단서의 도움에 영향을주기 위해 다양한 조작을 사용하고 있습니다.
유용성 / 비 유용성 측정은 상당히 긍정적으로 왜곡되어 있기 때문에 (대부분의 사람들이 항상 가장 유용한 10 가지 단서를 선택합니다) 측정 값이 계수 변수이기 때문에 Poisson Generalized Linear Model을 사용하여 이러한 데이터를 분석했습니다. 그러나 포아송 회귀에 대해 더 자세히 읽었을 때 포아송 회귀가 분포의 평균과 분산을 독립적으로 추정하지 않기 때문에 종종 데이터 집합의 분산을 과소 평가한다는 것을 알았습니다. 나는 quasipoisson 회귀 또는 음성 이항 회귀와 같은 Poisson 회귀에 대한 대안을 조사하기 시작했습니다. 그러나 나는 이런 종류의 모델에 익숙하지 않다는 것을 인정하므로 조언을 구하려고합니다.
이런 종류의 데이터에 사용할 모델에 대한 권장 사항이 있습니까? 알아야 할 다른 고려 사항이 있습니까 (예 : 특정 모델이 다른 모델보다 더 강력합니까?)? 선택한 모델이 내 데이터를 적절하게 처리하고 있는지 확인하기 위해 어떤 종류의 진단을 살펴 봐야합니까?