파라 메트릭 테스트에서 null을 거부하지 않으면 파라 메트릭이 아닌 대안도 동일합니까?


12

비모수 적 검정이 모수 적 대안에 비해 검정력이 낮다고 가정하는 경우, 모수 적 검정이 널을 거부하지 않는 경우 해당 모수가없는 대안도 널을 거부하지 않음을 의미합니까? 파라 메트릭 테스트의 가정이 충족되지 않고 테스트가 사용되는 경우 어떻게이 변경이 가능합니까?


4
(a) 가정 된 상황에서 검정 A가 검정 B보다 검정력이 낮을 경우, A가 기각 할 경우가 B의 하위 집합임을 의미하지는 않는다 (사실 고정 된 유의 수준에서는 불가능하다). 그들은 샘플 공간의 서로 다른 부분 (거의 겹치는 부분)을 거부합니다. 각각이 다른 부분이 그렇지 않은 것을 거부하는 경우가 있습니다. (b) 파라 메트릭 테스트의 가정이 충족되지 않으면 (실제로 충족 되었습니까?), 파라 메트릭 테스트의 전력이 상대적으로 열악 할 수 있습니다 (예 : 두꺼운 테일에서 T- 테스트 대 Mann-Whitney)
Glen_b -Reinstate Monica

답변:


9

모수 검정이 귀무 가설을 기각하지 못하는 경우 모수 비대칭 동등 물이 여전히 귀무 가설을 기각 할 수 있습니다. @John이 말했듯이 이것은 일반적으로 파라 메트릭 테스트의 사용을 보증하는 가정을 위반할 때 발생합니다. 예를 들어, 2- 표본 t- 검정을 Wilcoxon 순위 합계 검정과 비교하면 데이터에 특이 치를 포함하면 이러한 상황이 발생할 수 있습니다 (이상 치가있는 경우 두 표본 테스트를 사용하지 않아야 함).

#Test Data
x = c(-100,-100,rnorm(1000,0.5,1),100,100)
y = rnorm(1000,0.6,1)

#Two-Sample t-Test
t.test(x,y,var.equal=TRUE)

#Wilcoxon Rank Sum Test
wilcox.test(x,y)

테스트 실행 결과 :

> t.test(x,y,var.equal=TRUE)

    Two Sample t-test

data:  x and y 
t = -1.0178, df = 2002, p-value = 0.3089
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -0.6093287  0.1929563 
sample estimates:
mean of x mean of y 
0.4295556 0.6377417 

> 
> wilcox.test(x,y)

    Wilcoxon rank sum test with continuity correction

data:  x and y 
W = 443175, p-value = 5.578e-06
alternative hypothesis: true location shift is not equal to 0 

9

아니.

파라 메트릭 테스트는 더 강력 할 수 있지만 항상 그런 것은 아닙니다. 그렇지 않은 경우 일반적으로 파라 메트릭 테스트를 실행해서는 안되는 상황에 있습니다.

그러나 모수 검정이 더 큰 검정력을 갖는 동일한 분산으로 정규 분포에서 알맞은 크기의 표본을 수집하더라도 특정 실험에 대해 중요하지 않은 모수 검정이 중요하지 않은 비모수 검정을 의미한다고 보장하지는 않습니다. 다음은 정규 분포에서 랜덤 샘플링을 사용하고 t- 검정의 경우 p> 0.05 인 경우 Wilcoxon 검정의 경우 p <0.05 인 경우의 약 1.8 % 인 시뮬레이션을 보여줍니다.

nsim <- 10000
n <- 50
cohensD <- 0.2
Y <- replicate(nsim, {
    y1 <- rnorm(n, 0, 1); y2 <- rnorm(n, cohensD, 1)
    tt <- t.test(y1, y2, var.equal = TRUE)
    wt <- wilcox.test(y1, y2)
    c(tt$p.value, wt$p.value)})
sum(Y[1,] > 0.05 & Y[2,] < 0.05) / nsim

이 시뮬레이션에서 매개 변수 검정의 검정력은 비모수 검정보다 큽니다 (비록 유사하지만).

sum(Y[1,] < 0.05) / nsim #t-test power
sum(Y[2,] < 0.05) / nsim #wilcox.test power

그러나 위에 표시된 것처럼 파라 메트릭 테스트가 비모수 테스트에 실패한 효과를 찾지 못하는 모든 경우를 의미하지는 않습니다.

이 시뮬레이션으로 놀 수 있습니다. n을 1000으로 아주 크게 만들고 효과 크기를 0.02로 훨씬 작게 만듭니다 (테스트에 실패한 샘플이 많을 경우 저전력이 필요함). n의 1000으로 꽤 비표준 성 (거짓 테스트가 아닌 검사를 통해)에 대해 거부되거나 의심스러운 이상치 (outlier)를 갖지 않을 것이라는 점을 거의 보장 할 수 있습니다. 그러나 일부 파라 메트릭 테스트는 중요하지 않은 반면 비 파라 메트릭 테스트는 중요하지 않습니다.

Hunter & May (1993)도 볼 수 있습니다.

헌터, MA & R, May, RB (1993). 파라 메트릭 및 비 파라 메트릭 테스트에 관한 신화. 캐나다 심리학, 34 (4), 384-389.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.