내 과정의 연습 중 하나에서 Kaggle 의료 데이터 세트를 사용하고 있습니다.
운동은 말한다 :
개별 요금의 분포를 모형화하고 해당 분포에 대한 불확실성을 캡처하여 볼 수있는 값의 범위를 더 잘 포착 할 수 있기를 원합니다. 데이터로드 및 초기보기 수행 :
위와 같이 여기에 기하 급수적으로 분포하는 분포가 있다고 의심 할 수 있습니다. ... 보험 청구 비용은 여러 모달 일 수 있습니다. 감마 분포가 적용될 수 있으며, 보험 청구가 아닌 청구 금액의 분포에 대해이를 테스트 할 수 있습니다.
나는 고개 "감마 분포를"와 "인코딩 시간이«알파»에 대한«베타»의 평균 도착 시간과 포아송 과정에서 발생하는 이벤트를 요구하는 연속 긍정적 전용, 단봉 분포를"발견
여기에 관련된 시간이 없습니다, 단지 관련이없는 청구, 보험에 관계없이.
왜 감마 분포를 선택합니까?