동일하게 분포되지 않은 임의의 수의 변수 합계의 확률 분포를 찾으려고합니다. 예를 들면 다음과 같습니다.
John은 고객 서비스 콜센터에서 일합니다. 문제가있는 전화를 받고 해결하려고합니다. 그가 해결할 수없는 사람들을 상사에게 전달합니다. 그가 하루에받는 전화 수는 평균을 가진 포아송 분포를 따른다고 가정 해 봅시다.. 각 문제의 어려움은 아주 간단한 것들 (그가 확실히 다룰 수있는 것)에서 해결 방법을 모르는 매우 전문적인 질문에 이르기까지 다양합니다. 확률이그는 매개 변수가있는 베타 분포에 따른 i 번째 문제 를 해결할 수 있습니다. 과 이전 문제와 무관합니다. 그가 하루에 해결하는 통화 수의 분포는 무엇입니까?
더 공식적으로, 나는 가지고있다 :
...에 대한
어디 , 과
현재로서는 다음과 같이 가정합니다. 독립적입니다. 나는 또한 매개 변수를 수락합니다 과 실제 사례에서 서로에게 영향을 미치지 않습니다. 큰 매개 변수 과 베타 배포판이 낮은 성공률에서 더 많은 질량을 갖도록 . 그러나 지금은 그것을 무시합시다.
나는 계산할 수있다 그러나 그것은 그것에 관한 것입니다. 또한 분포가 무엇인지에 대한 아이디어를 얻기 위해 값을 시뮬레이션 할 수 있습니다. (포아송처럼 보이지만 그 숫자에 해당하는지 모르겠습니다. 과 시도했는지 또는 일반화되는지 여부와 다른 매개 변수 값에 따라 어떻게 변경 될 수 있습니까? 이 배포판이 무엇인지 또는 어떻게 배포 할 수 있는지에 대한 아이디어가 있습니까?
이 질문을 TalkStats 포럼 에도 게시 했지만 여기에서 더 많은 관심을 가질 수 있다고 생각했습니다. 교차 게시에 대한 사과와 시간 내 주셔서 감사합니다.
편집 : 그것이 밝혀 졌을 때 (아래 매우 유용한 답변을 참조하십시오-감사합니다!), 그것은 실제로분포, 직관과 시뮬레이션을 기반으로 추측했지만 증명할 수 없었습니다. 내가 지금 놀라운 것을 발견 한 것은, 포아송 분포가 단지 평균에 의존한다는 것입니다. 분포이지만 분산의 영향을받지 않습니다.
예를 들어, 다음 두 베타 분포는 평균은 다르지만 분산은 다릅니다. 명확성을 위해 파란색 pdf는 그리고 빨간 것 .
그러나 둘 다 동일한 결과를 낳습니다. 나에게는 약간 반 직관적 인 것처럼 보이는 분포. (결과가 잘못되었다고 말하는 것이 아니라 놀랍습니다!)