Poisson 분포를 따를 것으로 예상되는 데이터 세트가 있지만 약 3 배 정도 과대 산포되어 있습니다. 현재 R의 다음 코드와 같은 것을 사용하여이과 분산을 모델링하고 있습니다.
## assuming a median value of 1500
med = 1500
rawdist = rpois(1000000,med)
oDdist = rawDist + ((rawDist-med)*3)
시각적으로 이것은 경험적 데이터에 매우 잘 맞는 것 같습니다. 적합에 만족하면 여기에 설명 된대로 음 이항 분포를 사용하는 것과 같이 더 복잡한 작업을 수행해야하는 이유가 있습니까? (그렇다면 그렇게 할 때의 어떤 포인터 나 링크도 대단히 감사하겠습니다).
아, 그리고 이것이 3의 곱셈으로 인해 약간 들쭉날쭉 한 분포를 생성하지만 내 응용 프로그램에는 중요하지 않다는 것을 알고 있습니다.
업데이트 : 이 질문을 검색하고 찾는 다른 사람을 위해 음의 이항 분포를 사용하여과 분산 된 포아송을 모델링하는 간단한 R 함수가 있습니다. d를 원하는 평균 / 분산 비율로 설정하십시오.
rpois.od<-function (n, lambda,d=1) {
if (d==1)
rpois(n, lambda)
else
rnbinom(n, size=(lambda/(d-1)), mu=lambda)
}
(R 메일 링리스트를 통해 : https://stat.ethz.ch/pipermail/r-help/2002-June/022425.html )