다음과 같은 카운트 데이터 히스토그램이 있습니다. 그리고 나는 이것에 개별 분포를 적용하고 싶습니다. 어떻게해야할지 모르겠습니다.
먼저 히스토그램에 불연속 분포와 같은 불연속 분포를 중첩하여 이산 분포의 모수를 구한 다음 Kolmogorov–Smirnov 검정을 실행하여 p- 값을 확인해야합니까?
이 방법이 올바른지 확실하지 않습니다.
이와 같은 문제를 해결하는 일반적인 방법이 있습니까?
카운트 데이터의 빈도 표입니다. 내 문제에서는 0이 아닌 카운트에만 집중하고 있습니다.
Counts: 1 2 3 4 5 6 7 9 10
Frequency: 3875 2454 921 192 37 11 1 1 2
업데이트 : 묻고 싶습니다 : R의 fitdistr 함수를 사용하여 데이터 피팅을위한 매개 변수를 얻었습니다.
fitdistr(abc[abc != 0], "Poisson")
lambda
1.68147852
(0.01497921)
그런 다음 히스토그램 위에 포아송 분포의 확률 질량 함수를 플로팅합니다.
그러나 포아송 분포가 카운트 데이터를 모델링하지 못하는 것 같습니다. 제가 할 수 있는게 있나요?
?MASS::fitdistr
이미 R 분포에 있기 때문에 여기서 시작 했습니다 (아래의 마지막 예를 참조하십시오. 음이 항의 매개 변수화에 대한 자세한 내용은 rnegbin을 참조하십시오). .... " ML을 찾은 후 다음에 무엇을해야합니까? "-그 시점에서 매개 변수 추정치 및 표준 오류가 있습니다. 그 외에도 무엇을 달성하고 싶습니까? -나는 추측 할 수 없다.