비 수학자를위한 Clopper-Pearson


12

누군가 Clopper-Pearson CI 이외의 직관에 대한 비율을 설명 할 수 있는지 궁금합니다.

내가 아는 한 모든 CI에는 차이가 있습니다. 그러나 비율의 경우 비율이 0 또는 1 (0 % 또는 100 %) 인 경우에도 Clopper-Pearson CI를 계산할 수 있습니다. 수식을 보려고 시도했는데 이항 분포의 백분위 수를 갖는 것으로 이해하고 CI를 찾는 데 반복이 포함된다는 것을 알고 있지만, 누군가가 "단순 단어"또는 최소한의 수학으로 논리와 합리성을 설명 할 수 있을지 궁금했습니다. ?

답변:


22

분산에 대한 표현식을 포함하는 신뢰 구간에 익숙하다고 가정하면 모집단을 특징 짓는 두 매개 변수 (평균 및 분산)에 대한 정보가 표본으로 요약되는 가우시안 사례를 생각하게됩니다. 평균 및 표본 분산. 표본 평균은 모집단 평균을 추정하지만 그렇게하는 정밀도는 표본 분산에 의해 차례로 추정 된 모집단 분산에 따라 달라집니다. 반면 이항 분포는 하나의 매개 변수 (각 개별 시행에서 성공할 확률)와이 매개 변수에 대한 샘플에서 제공 한 모든 정보가 총계로 요약됩니다. 수많은 독립적 인 시도에서 성공. 모집단 분산과 평균은 모두이 매개 변수에 의해 결정됩니다.

이항 확률 질량 함수와 직접 작동 하는 매개 변수 대한 Clopper-Pearson 95 % (예 :) 신뢰 구간을 얻을 수 있습니다 . 번의 시행 중 번의 성공 을 관찰한다고 가정합니다 . pmf는x nπxn

Pr(X=x)=(nx)πx(1π)nx

증가 의 확률까지 당신의 상한 것 : 이하의 성공 2.5 %로 떨어진다. 감소 의 확률까지 당신의 하한이다 : 이상의 성공이 2.5 %까지로 떨어진다. (실제로 읽지 못하는 경우이 작업을 실제로 시도하는 것이 좋습니다.) 여기서 수행하는 것은 null 가정으로 취했을 때 값을 찾는 것입니다. 5 %의 유의 수준에서 양측 검정. 장기적 으로이 방법으로 계산 된 경계 는 시간의 95 % 이상이 무엇이든간에 의 실제 값을 포괄합니다 .πxπxππ


+1. 이것은 자체적으로 질문을받을 가치가 있지만 여기서 빨리 물어볼 것입니다 : 특정 응용 프로그램의 경우 다양한 비율에 대해 단일 불확실성 측정 (평균의 표준 오차와 같은 행동)을 얻고 싶습니다. Clopper-Pearson을 포함하여 여러 이항 CI 절차가 있음을 알고 있습니다. 불확실성 측정과 같은 CI의 폭을 취하는 것이 합리적입니까? 또는 가우스 한계에서 정확히 SEM을 산출하도록 width / 1.96 / 2 일 수 있습니다.
amoeba 말한다 Reinstate Monica

1
@amoeba : 아마도 당신은 작은 표본 크기에 대해 생각하고있을 것입니다. (2) 신뢰 분포는 다소 고르지 않으므로 지정된 간격의 너비가 지정한 적용 범위에 불쾌하게 민감하게됩니다.
Scortchi-Monica Monica 복원
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.