결정적이지 않은 결과가있는 테스트의 또 다른 예는 샘플 크기가 아닌 비율 만 사용할 수있는 경우 비율에 대한 이항 테스트입니다. 이것은 완전히 비현실적이지는 않습니다. 우리는 종종 "73 %의 사람들이 동의합니다 ..."와 같은 형식의 주장이 잘못보고 된 것을 보거나 듣습니다.
예를 들어, 샘플 비율 이 가장 가까운 전체 퍼센트로 반올림 된 것만 알고 있고 수준 에서 에 대해 를 테스트하려고 합니다.H0:π=0.5H1:π≠0.5α=0.05
관측 된 비율이 이면 관측 된 비율의 표본 크기는 19 이상이어야합니다. 는 분모가 가장 낮은 분수이므로 반올림하기 때문 입니다. 관찰 된 성공 횟수가 실제로 19 개 중 1 개, 20 개 중 1 개, 21 개 중 1 개, 22 개 중 1 개, 22 개 중 1 개, 37 개 중 2 개, 38 개 중 2 개, 55 개 중 3 개, 5 개 중 5 개 1000 개 중 100 개 또는 50 개 ...하지만 둘 중 어느 쪽이든 결과는 수준 에서 중요 합니다.p=5%1195%α=0.05
반면에 표본 비율이 라는 것을 알면 관찰 된 성공 횟수가 100 개 중 49 개 (이 수준에서는 중요하지 않음)인지 10,000 개 중 4900 개인 지 의미를 얻습니다). 따라서이 경우 결과는 결정적이지 않습니다.p=49%
참고 함께 둥근 심지어 : 백분율 아니오 영역 "거부에 실패"없다 2 개 시험 중 1 개 성공 등 49,500 거부 초래 100,000 아웃 성공뿐만 아니라, 시료 등의 샘플과 일치 을 거부하지 못하게됩니다 .p=50%H0
더빈-왓슨 (Durbin-Watson) 테스트와 달리 나는 백분율이 중요한 표로 작성된 결과를 본 적이 없다. 임계 값에 대한 상한 및 하한이 없으므로이 상황은 더 미묘합니다. 의 결과 는 명백히 결정적이지 못합니다. 한 번의 시험에서 0 번의 성공은 미미하지만 백만 번의 시험에서 큰 성공은 없을 것이기 때문입니다. 우리는 이미 가 결정적이지 않지만 그 사이에 와 같은 중요한 결과 가 있음을 이미 보았다 . 또한 컷오프가 없다는 것은 및 의 예외적 인 경우 때문이 아닙니다 . 해당하는 가장 중요하지 않은 샘플을 약간 재생p=0%p=50%p=5%p=0%p=100%p=16%19의 샘플에서 성공으로,이 경우 이므로 중요합니다. 에 대한 우리는 미미 6 개 시험에서 1 개 성공이있을 수 있습니다, 이 경우는 (와 분명히 다른 샘플이 있기 때문에 결정적 그래서 되는 중요 할 것이다); 위한 11 개 시험 2 개의 성공이 될 수도있다 (사소한 )이 경우도 불확실하므로; 그러나 경우 최소 가능성이 가장 적은 샘플은 하여 19 번의 시도에서 3 회 성공 하므로 다시 중요합니다.Pr(X≤3)≈0.00221<0.025p=17%Pr(X≤1)≈0.109>0.025p=16%p=18%Pr(X≤2)≈0.0327>0.025p=19%Pr(X≤3)≈0.0106<0.025
실제로 는 50 % 미만의 가장 높은 반올림 백분율로 5 % 수준에서 분명하게 중요합니다 (최고의 p- 값은 17 번의 시도에서 4 번의 성공에 해당하며 단지 유의미 함). 결론은 결정적이지 않은 0이 아닌 가장 낮은 결과입니다 (8 회 시도에서 1 회 성공할 수 있기 때문에). 위의 예에서 볼 수 있듯이 사이에서 일어나는 일이 더 복잡합니다! 아래 그래프는 빨간색 선이 있습니다. 선 아래의 점은 확실하지만 그 위의 점은 결정적이지 않습니다. p- 값의 패턴은 결과가 명백하게 의미있는 것으로 관찰 된 백분율에 대한 단일 하한 및 상한이 존재하지 않도록하는 것이다.p=24%p=13%α=0.05
R 코드
# need rounding function that rounds 5 up
round2 = function(x, n) {
posneg = sign(x)
z = abs(x)*10^n
z = z + 0.5
z = trunc(z)
z = z/10^n
z*posneg
}
# make a results data frame for various trials and successes
results <- data.frame(successes = rep(0:100, 100),
trials = rep(1:100, each=101))
results <- subset(results, successes <= trials)
results$percentage <- round2(100*results$successes/results$trials, 0)
results$pvalue <- mapply(function(x,y) {
binom.test(x, y, p=0.5, alternative="two.sided")$p.value}, results$successes, results$trials)
# make a data frame for rounded percentages and identify which are unambiguously sig at alpha=0.05
leastsig <- sapply(0:100, function(n){
max(subset(results, percentage==n, select=pvalue))})
percentages <- data.frame(percentage=0:100, leastsig)
percentages$significant <- percentages$leastsig
subset(percentages, significant==TRUE)
# some interesting cases
subset(results, percentage==13) # inconclusive at alpha=0.05
subset(results, percentage==24) # unambiguously sig at alpha=0.05
# plot graph of greatest p-values, results below red line are unambiguously significant at alpha=0.05
plot(percentages$percentage, percentages$leastsig, panel.first = abline(v=seq(0,100,by=5), col='grey'),
pch=19, col="blue", xlab="Rounded percentage", ylab="Least significant two-sided p-value", xaxt="n")
axis(1, at = seq(0, 100, by = 10))
abline(h=0.05, col="red")
(반올림 코드는 이 StackOverflow 질문에서 제외 됩니다.)