불연속 간격 범위를 계산하는 방법?
내가하는 방법 :
연속 모형이있는 경우 예측 된 각 값에 대해 95 % 신뢰 구간을 정의한 다음 실제 값이 신뢰 구간 내에 얼마나 자주 있었는지 확인할 수 있습니다. 95 % 신뢰 구간이 실제 값을 다루는 시간의 88 % 만 발견 할 수 있습니다.
내가 어떻게 해야할지 모르겠다 :
포아송 또는 감마-포아송과 같은 불연속 모델의 경우 어떻게해야합니까? 이 모델에 대한 것은 다음과 같습니다. 단일 관찰을 수행합니다 (10 만개 이상 생성 할 계획입니다).
관찰 번호 : (임의)
예상 값 : 1.5
예측 확률 0 : .223
1 : 1의 예측 확률
2 : 2의 예측 확률
예측 확률 3 :
4의 예측 확률 : .048
예측 확률 5 : .014 [그리고 5 이상은 .019]
...(기타)
예측 확률 100 (또는 다른 비현실적인 수치) : .000
실제 값 ( "4"와 같은 정수)
위의 포아송 값을 제공했지만 실제 모델에서 예측 된 값 1.5는 관측에 따라 0,1, ... 100의 예측 확률이 다를 수 있습니다.
나는 값의 불연속성으로 혼란스러워합니다. "5"는 5 % 이상 .019 만 있고 .025보다 작기 때문에 분명히 95 % 간격을 벗어납니다. 그러나 많은 4가있을 것입니다-개별적으로 내부에 있지만 4의 수를 더 적절하게 공동으로 평가하려면 어떻게해야합니까?
왜 신경 쓰나요?
내가보고있는 모델은 집계 수준에서 정확하지만 개별 예측이 좋지 않다는 비판을 받았습니다. 모델이 예측 한 본질적으로 넓은 신뢰 구간보다 열악한 개별 예측이 얼마나 나쁜지 알고 싶습니다. 나는 경험적 적용 범위가 더 나빠질 것으로 예상하고 있습니다 (예 : 값의 88 %가 95 % 신뢰 구간 내에 있음을 알 수 있습니다).