추정값이 (또는 유사하게 p = 1 )이고 표본 크기가 비교적 작은 경우 (예 : n = 25 ) 이항 실험의 신뢰 구간을 계산하는 가장 좋은 방법은 무엇입니까 ?
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
추정값이 (또는 유사하게 p = 1 )이고 표본 크기가 비교적 작은 경우 (예 : n = 25 ) 이항 실험의 신뢰 구간을 계산하는 가장 좋은 방법은 무엇입니까 ?
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
답변:
이 문제에 대해 많은 글을 썼습니다. 일반적인 조언은 커버리지 속성이 끔찍하기 때문에 정규 근사 (즉, 점근 적 / 구간 신뢰 구간)를 사용 하지 않는 것입니다. 이것을 설명하기위한 R 코드 :
library(binom)
p = seq(0,1,.001)
coverage = binom.coverage(p, 25, method="asymptotic")$coverage
plot(p, coverage, type="l")
binom.confint(0,25)
abline(h=.95, col="red")
작은 성공 확률의 경우 95 % 신뢰 구간을 요청할 수 있지만 실제로는 10 % 신뢰 구간을 얻습니다!
그래서 무엇을 해야 우리가 사용할 수 있습니까? 나는 현재의 권고가 용지에 나와있는 것들 생각 이항 비율의 구간 추정 브라운, 카이와 다스 굽타에 의해 통계 과학 2001 권. 16 번 2, 101 ~ 133 쪽. 저자는 신뢰 구간을 계산하기위한 몇 가지 방법을 조사하여 다음과 같은 결론을 내렸다.
[W] e는 작은 n에 대해서는 Wilson 간격 또는 등 꼬리 Jeffreys 이전 간격 과 n에 대해서는 Agresti 및 Coull에 제안 된 간격을 권장 합니다.
윌슨 간격은 점수 테스트 반전을 기반으로하기 때문에 점수 간격 이라고도합니다 .
이러한 신뢰 구간을 계산하려면 이 온라인 계산기 또는 R binom.confint()
의 binom
패키지에 있는 함수를 사용할 수 있습니다 . 예를 들어 25 회 시행에서 0 회 성공한 경우 R 코드는 다음과 같습니다.
> binom.confint(0, 25, method=c("wilson", "bayes", "agresti-coull"),
type="central")
method x n mean lower upper
1 agresti-coull 0 25 0.000 -0.024 0.158
2 bayes 0 25 0.019 0.000 0.073
3 wilson 0 25 0.000 0.000 0.133
다음 bayes
은 Jeffreys 간격입니다. ( 등호 간격 type="central"
을 얻으려면 인수 가 필요 합니다.)
구간을 계산 하기 전에 사용할 세 가지 방법 중 어떤 것을 사용할지 결정해야 합니다. 세 가지를 모두보고 가장 짧은 것을 선택하면 자연스럽게 너무 작은 적용 확률이 제공됩니다.
마지막으로, n 시도 에서 정확히 0의 성공을 관찰 하고 매우 빠른 근사 신뢰 구간을 원한다면 3 규칙을 사용할 수 있습니다 . 간단히 숫자 3을 n으로 나눕니다 . 위의 예에서 n 은 25이므로 상한은 3/25 = 0.12입니다 (하한은 물론 0).
bayes
두 가지 형상 매개 변수가 모두 1 인 경우 균일 한 사전 (제프리 대신)을 사용합니다. 나는 이전의 제프리와 유니폼의 (단점) 장점에 대한 호기심으로 이항 패키지의 관리자에게 이메일을 보냈으며 새 버전이 사용될 것이라고 말했습니다. 기본적으로 균일 한 사전. 결과가 미래에 조금씩 변하는 지 궁금하지 마십시오.
binconf
방법은 Hmisc
또한 이러한 간격을 계산합니다. 기본값은 Wilson 메소드입니다.