불균형 분산에서의 Man-Whitney 귀무 가설


9

Mann-Whitney U 검정의 귀무 가설이 궁금합니다. 나는 종종 귀무 가설이 두 모집단이 동일한 분포를 가지고 있다고 언급 한 것을 본다. 그러나 나는 생각합니다-평균이 같지만 극도로 불균등 한 분산을 가진 두 개의 정규 모집단이 있다면 Mann-Whitney 검정은 아마도이 차이를 감지하지 못할 것입니다.

또한 Mann-Whitney 검정의 귀무 가설이 이거나 한 모집단 ( X ) 의 관측 확률이 두 번째 모집단 ( Y ) 의 관측치를 초과 함을 확인했습니다 (후 동점 제외)는 0.5와 같습니다. 이것은 조금 더 의미가있는 것처럼 보이지만 내가 언급 한 첫 번째 귀무 가설과 동일하지는 않습니다.Pr(X>Y)=0.5XY

나는 이것을 풀기 위해 약간의 도움을 받기를 바라고있다. 감사!

답변:


5

Mann-Whitney 검정은 순열 검정의 특별한 경우이며 (널 아래의 분포는 데이터의 가능한 모든 순열을 모두보고 파생됩니다) 순열 테스트는 널이 동일한 분포로되어 있으므로 기술적으로 정확합니다.

Mann-Whitney 검정 통계량을 생각하는 한 가지 방법은 한 그룹에서 임의로 선택한 값이 다른 그룹에서 임의로 선택한 값을 초과하는 횟수를 측정하는 것입니다. 따라서 P (X> Y) = 0.5도 의미가 있으며 이것은 기술적으로 등분 포가 null 인 속성입니다 (동점 확률이 0 인 연속 분포를 가정). 두 분포가 동일하면 X가 Y보다 더 클 확률은 0.5입니다. 두 분포가 모두 동일한 분포에서 도출되기 때문입니다.

평균은 동일하지만 광범위하게 다른 분산을 갖는 2 개의 분포의 경우는 두 번째 귀무 가설과 일치하지만 동일한 분포의 첫 번째 분포와 일치하지 않습니다. 이 경우 p- 값이 어떻게되는지보기 위해 시뮬레이션을 수행 할 수 있습니다 (이론적으로 균일하게 분포되어야 함).

> out <- replicate( 100000, wilcox.test( rnorm(25, 0, 2), rnorm(25,0,10) )$p.value )
> hist(out)
> mean(out < 0.05)
[1] 0.07991
> prop.test( sum(out<0.05), length(out), p=0.05 )

        1-sample proportions test with continuity correction

data:  sum(out < 0.05) out of length(out), null probability 0.05
X-squared = 1882.756, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.05
95 percent confidence interval:
 0.07824054 0.08161183
sample estimates:
      p 
0.07991 

따라서 분명히 이것은보다 자주 거부되고 귀무 가설은 거짓입니다 (분포의 평등과 일치하지만 prob = 0.5는 아닙니다).

Efron의 주사위를 기반으로하는 인구를 비교할 경우 X> Y의 확률로 생각하면 흥미로운 문제가 발생합니다 .


안녕 그렉, 답변 주셔서 감사합니다. 그것은 당신이 말하는 것처럼 들립니다. 균등 분포 널에서 테스트가 제대로 작동하지 않는 특별한 경우가 있다는 것을 알았습니다. 또한, 내가 언급 한 귀무 가설은 동일하지 않습니다. 그 맞습니까?
Jimj

4

Mann-Whitney는 평균이 같은 분산 변화에 민감하지 않지만 형식에서 볼 수 있듯이 가 에서 벗어난 차이를 감지 할 수 있습니다 (예 : 평균과 분산이 함께 증가하는 경우). 평균이 같은 두 개의 법선이 있다면 분명히 그 차이는 0에 대해 대칭입니다. 따라서 . 이는 null 상황입니다.P(X>Y)=0.5P(X>Y)0.5P(X>Y)=P(XY>0)=12

예를 들어, 분포 가 평균 인 지수 분포 이고 분포가 평균 (규모 변화) 지수 분포 인 경우 Mann-Whitney는 이에 민감합니다 (실제로 양쪽의 로그를 취하면 위치-이동 및 Mann-Whitney는 단조 변환에 영향을받지 않습니다).Y1Xk

-

평균-중등도 하에서 산포의 차이에 민감한 Mann-Whitney와 개념적으로 매우 유사한 시험에 관심이 있다면 , 그러한 시험이 몇 가지 있습니다.

있다 시겔-Tukey에의 테스트와 안사리 - 브래들리 시험은 모두 밀접한 맨 - 휘트니 - 윌 콕슨이 샘플 테스트와 관련된, 예를 들어,.

그들은 둘 다 끝에서 순위의 기본 아이디어를 기반으로합니다.

R을 사용하면 Ansari-Bradley 테스트가 내장됩니다 ... ?ansari.test

Siegel-Tukey는 사실상 Mann-Whitney-Wilcoxon 테스트를 샘플과 다르게 계산 된 순위에서 수행합니다. 데이터를 직접 순위 매기는 경우 실제로 p- 값에 대해 별도의 함수가 필요하지 않습니다. 그럼에도 불구하고 다음과 같이 일부를 찾을 수 있습니다.

http://www.r-statistics.com/2010/02/siegel-tukey-a-non-parametric-test-for-equality-in-variability-r-code/

-

(내 원래 답변 아래의 ttnphns의 의견과 관련하여)

귀하는 @GregSnow에 동의하지 않는 것으로 특히 중요한 의미로 그것을 읽도록 나의 응답을 과도하게 해석 할 것입니다. 분명히 강조점과 우리가 이야기하는 것에 약간의 차이가 있지만, 그 뒤에 실제로 많은 의견 차이가있는 경우 매우 놀랐습니다.

Mann과 Whitney의 말을 인용 해 봅시다 : " 와 의 상대적 순위에 따른 통계 는 가설 검정하기 위해 제안 됩니다 . " @GregSnow의 위치를 ​​완전히 지원합니다.Uxyf=g

"자,하자가 통계 구성하는 방법을 참조 하자 횟수를 카운트 선행을 .Uyx 이제" 경우 자신의 널 (null)이 참, 그 사건의 확률은 ...하지만 0.5의 확률을 얻는 다른 방법이 있으며, 그런 의미에서 테스트가 다른 환경에서 작동 할 수 있다고 해석 할 수 있습니다. 그들이 > 인 ( 축척 된) 확률을 추정하는 한 , 그것은 내가 말한 것을지지합니다.12YX

그러나 유의 수준이 정확하게 정확 하도록하려면 널 분포와 일치하도록 분포가 필요합니다 . 이는 및 그룹 레이블 레이블이 널 (null) 아래의 결합 된 관측치에 대한 모든 순열 이 균등했을 가능성이 있다는 가정에서 도출 된 것입니다. 이것은 확실히 의 경우 입니다. @GregSnow가 말한대로.UXYf=g

문제는 더 일반적으로 표현되는 널 (null)에 대해 이것이 사실 인 정도 (즉, 검정 통계량의 분포가 또는 대략 같은 가정 하에서 도출 된 것과 일치하는 정도)입니다.f=g

나는 많은 상황에서 그렇게한다고 믿는다. 특히 당신이 묘사 한 것보다 더 일반적인 상황 (같은 평균이지만 극도로 불균등 한 분산을 가진 두 개의 정규 모집단은 순위에 따라 결과 분포를 변경하지 않고도 상당히 일반화 될 수 있음)의 경우, 통계량 분포는 그것이 파생 된 것과 동일한 분포를 갖는 것으로 밝혀 졌으므로 유효해야합니다. 이것을 지원하는 것처럼 보이는 시뮬레이션을했습니다. 그러나 항상 유용한 테스트는 아닙니다 (전원이 약할 수 있음).

이것이 사실이라는 증거는 없습니다. 나는 직감 / 손잡이 논쟁을 적용하고 그것이 사실임을 암시하는 몇 가지 기본 시뮬레이션을 수행했습니다 .Mann-Whitney는 때보 다 훨씬 광범위하게 작동합니다 (null 아래에 '오른쪽 분포'가 있음). .f=g

당신이 무엇을 할 지 결정하지만, 나는 이것을 @GregSnow와의 실질적인 의견 불일치로 해석하지 않습니다.

참고 -Mann & Whitney의 원본


나는 당신이 위키 백과의 맨 - 휘트니 토론 문서에서이 말에 동의 바로 당신을 받으셨어요 : the null hypothesis of Mann-Whitney U-test is not about the equality of distributions. Is is about the symmetry between two populations with respect to the probability of obtaining a larger observation. 그리고 당신은 @Greg의 대답에 동의하지 않습니다.
ttnphns

편집에 토론을 추가했습니다.
Glen_b-복지 주 모니카

아주 좋은 추가. 나는 그것을 공부 할 것입니다. "MW 테스트 통계는 평균 순위 의 (평등) 평등을 반영하기 때문에 f ~ = g [f, g를 원래 분포, 사전 순위로 이해합니다.]라는 상황이있을 수 있습니다. 테스트는 f = g에서와 동일한 H0를 계속 처리하므로 완전히 관련이 없습니다. 그러한 상황의 예는 확산 모수 (분산)를 제외하고 는 완전히 동일한 대칭 분포 입니다. "
ttnphns

표기법에서 (Mann과 Whitney 's) 와 는 와 의 밀도입니다 . 본인은 상황을 확인 / 이해 한 범위 내에서 귀하의 진술이 사실 인 것으로 동의합니다. 나는 Mann-Whitney에 대해 아직도 나를 피하는 많은 것이 있다고 생각합니다. fgXY
Glen_b-복지 주 모니카
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.