R의 Wilcoxon-Mann-Whitney 임계 값


10

R을 사용하여 Mann-Whitney U의 임계 값을 찾으려고하면 값이 항상 1+ 임계 값이라는 것을 알았습니다. 예를 들어, 의 경우 (양측) 임계 값은 8이며 의 경우 (양측) ) 임계 값은 22 ( 확인 )이지만 다음과 같습니다.α=.05,n=10,m=5α=.05,n=12,m=8

> qwilcox(.05/2,10,5)
[1] 9
> qwilcox(.05/2,12,8)
[1] 23

물론 나는 무언가를 고려하고 있지 않지만, 아무도 왜 나에게 설명 할 수 있습니까?

답변:


17

나는 여기에 대한 대답은 당신이 사과와 오렌지를 비교하고 있다고 생각합니다.

하자 맨 - 휘트니의 CDF 나타내는 통계를. 의 양자 함수 입니다 . 따라서 정의에 따르면 U Q ( α ) UF(x)UqwilcoxQ(α)U

Q(α)=inf{xN:F(x)α},α(0,1).

는 이산 이므로 일반적으로 와 같은 는 없으므로 일반적으로 입니다.x F ( x ) = α F ( Q ( α ) ) > αUxF(x)=αF(Q(α))>α

이제 테스트 의 임계 값 를 고려하십시오 . 이 경우 가 필요합니다. 그렇지 않으면 공칭보다 유형 I 오류율로 테스트를 수행하기 때문 입니다 . 이것은 일반적으로 바람직하지 않은 것으로 간주됩니다. 보수적 인 테스트가 선호되는 경향이 있습니다. 따라서 가 아니라면 되도록 , 따라서 우리가 .F ( C ( α ) ) α C ( α ) = SUP { X N : F ( X ) α } ,C(α)F(C(α))αx F ( x ) = α C ( α ) = Q ( α ) 1

C(α)=sup{xN:F(x)α},α(0,1).
xF(x)=αC(α)=Q(α)1

불일치의 이유는 qwilcox임계 값이 아닌 Quantile을 계산하도록 설계 되었기 때문입니다!


1
(+1) 간단하고 간결한 설명입니다. :)
추기경

2

순위 합계 검정 통계량은 이산 꼬리 확률이 지정된 에 대해 가되도록 임계 값을 사용해야합니다 . 알파와 같은 일부 샘플 크기의 경우 달성 할 수 없으며 왜 +1이 필요한지 추측됩니다.αα


4
그렇다면 일반적인 테이블이 아닌 R에 +1이 필요한 이유는 무엇입니까?
MånsT

1
@ this.is.not.a.nick : 아마도 더 중요하게는 반면에 . 이는 전자의 경우 실제 유의 수준이 이고 후자의 경우 가됨을 의미합니다 . 일반적으로 사람들은 오른쪽에서 실수하는 것을 선호하는 경향이 있습니다. 즉, 명목보다 유의 수준이 낮습니다 (표의 값이 바람직 함을 의미 함). 0.02868937 > 0.025 < 0.05 > 0.050.0236723<0.0250.02868937>0.025<0.05>0.05
MånsT

1
Procrastinator와 MansT에 대한 권리. 실제로 유의 수준의 정의는 꼬리 확률이 알파보다 높지 않아야합니다. 나는 Clopper-Pearson 방법을 통한 정확한 이항 검정을위한 힘 함수의 톱니 모양의 행동에 대해 Christine Liu와 함께 내 논문에서 이야기합니다 (American Statistician (2002) 참조).
Michael R. Chernick

2
@Michael : 이 페이지와 같은 페이지에 있습니다. 표는 표준 정의를 따르므로 임계 값이 Quantile이 아닙니다.
MånsT

3
@ 마이클 : 동의합니다. 어떤 의미에서, qwilcox해야 할 일을하지만, 기대했던 것은하지 않습니다.
MånsT
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.