음의 이항 분포는 생물 정보학에서 카운트 데이터 (특히 주어진 실험으로부터 게놈의 주어진 영역 내에서 예상되는 수의 서열 판독 횟수)에 대한 대중적인 모델이되었다. 설명은 다양합니다.
- 일부는 이것을 포아송 분포와 같이 작동하지만 추가 모수를 가지므로 평균과 반드시 같지 않은 분산으로 실제 분포를 더 자유롭게 모델링 할 수 있습니다.
- 일부는 이것을 포아송 분포의 가중 혼합으로 설명합니다 (푸 아송 모수의 감마 혼합 분포)
특정 수의 실패를보기 전에 Bernoulli 시도의 성공 횟수를 모델링 할 때 음의 이항 분포에 대한 전통적인 정의로 이러한 근거를 제곱하는 방법이 있습니까? 아니면 감마 혼합 분포를 갖는 푸 아송 분포의 가중 혼합이 음의 이항과 같은 확률 질량 함수를 갖는다는 것이 우연의 일치라고 생각해야합니까?