음 이항 분포와 이항 분포의 차이점은 무엇입니까?
온라인에서 읽으려고했는데 데이터 포인트가 이산적일 때 음의 이항 분포가 사용된다는 것을 알았지 만 이항 분포조차도 이산 데이터 포인트에 사용할 수 있다고 생각합니다.
음 이항 분포와 이항 분포의 차이점은 무엇입니까?
온라인에서 읽으려고했는데 데이터 포인트가 이산적일 때 음의 이항 분포가 사용된다는 것을 알았지 만 이항 분포조차도 이산 데이터 포인트에 사용할 수 있다고 생각합니다.
답변:
차이점은 우리가 관심을 갖고있는 것입니다. 두 분포 모두 독립적 인 Bernoulli 시험에서 고정 된 확률로 성공했습니다 ( p) .
이항 분포에서 랜덤 변수 X 는 n 번의 시도 에서 관찰 된 성공 횟수입니다 . 시행 횟수는 고정되어 있으므로 가능한 X 값 은 0, 1, ..., n 입니다.
음 이항 분포에서 랜덤 변수 Y는 r 번째 성공이 관찰 될 때까지 시행 횟수입니다 . 이 경우, 우리는 r 성공에 도달 할 때까지 시도 횟수를 계속 증가시킵니다 . Y의 가능한 값은 r , r + 1 , r + 2 , ...이며 상한이 없습니다. 음 이항도의 수의 관점에서 정의 할 수 있습니다 실패 까지 R 대신의 수, 성공 일 시험 까지 R 번째 성공. Wikipedia 는 이러한 방식으로 음 이항 분포를 정의합니다.
요약하면 다음과 같습니다.
이항 :
음 이항 :
두 배포판의 지원에 대해 언급 할 것을 상기시켜 준 Ben Bolker에게 감사합니다. 그는 관련 질문에 대답 했다 .
이항과의 명백한 관계에도 불구하고 음 이항 분포는 실제로 포아송 분포와 비교하여 더 좋습니다. 세 사람 모두 불 연속적입니다.
데이터가 분산이 평균 (과대 분산)보다 크다고 제안하면 포아송을 배제한 다음 음 이항은 다음에 볼 분포입니다. 매개 변수가 둘 이상이므로 분산이 평균보다 클 수 있습니다.
NJ와 이항식의 관계는 @Jelsema의 답변에 설명 된 것처럼 기본 프로세스에서 비롯됩니다. 이 과정은 관련되어 있으므로 분포도 비슷하지만 여기서 설명했듯이 Poisson 분포에 대한 링크는 실제 응용 분야에서 더 가깝습니다.
업데이트 : 또 다른 측면은 매개 변수입니다. 이항 분포에는 p와 n의 두 매개 변수가 있습니다. 선의 도메인은 0에서 n까지입니다. 그것은 이산 일뿐만 아니라 유한 한 수의 집합에서도 정의된다.