R의 wilcox.test ()에 의한 W 통계량 출력은 U 통계량과 동일합니까?

최근 Mann-Whitney U 테스트에 대해 읽었습니다. R에서이 테스트를 수행하려면 실제로 Wilcoxon 테스트를 실행해야합니다.

내 질문 : wilcox.testR 의 W 통계 는 U 통계와 동일합니까?

r wilcoxon-mann-whitney

— 루시아노
소스

답변:

윌 콕슨 (Wilcoxon)은 일반적으로 테스트의 최초 발명자 *로 인정 받았지만 Mann과 Whitney의 접근 방식은 큰 발전을 보였으며 통계가 정리 된 사례를 확장했습니다. 필자는 테스트를 Wilcoxon-Mann-Whitney로 언급하여 두 가지 기여를 모두 인식하는 것을 선호합니다 (Mann-Whitney-Wilcoxon도 표시됨).

* 그러나 실제 그림은 조금 더 흐릿합니다. 몇몇 다른 저자들도이 시간 또는 그 이전에 대해 동일하거나 유사한 통계를 제시하거나 경우에 따라 테스트와 밀접하게 관련된 기여를합니다. 최소한 일부 크레딧은 다른 곳으로 가야합니다.

Wilcoxon 테스트와 Mann-Whitney U 테스트는 동일한 상황에서 항상 동일한 사례를 거부한다는 점에서 동등합니다 (그리고 도움 상태는 동일합니다). 대부분의 테스트 통계는 교대에 의해서만 달라집니다 (일부 경우에는 부호 변경 만 가능).

Wilcoxon 검정은 문헌에서 여러 가지 방법으로 정의되며 모호함은 시험 통계의 원래 표로 거슬러 올라갑니다. 따라서 Wilcoxon 검정에 대해 논의 할 때주의를 기울여야합니다.

이 두 쌍의 게시물에서 가장 일반적인 두 가지 형태의 정의에 대해 설명합니다.

R에서 윌 콕슨 순위 합계 테스트

Wilcoxon 순위 합계 검정에 대한 검정 통계량을 계산하는 다른 방법

특히 R에서 발생하는 문제를 해결하려면 다음을 수행하십시오.

wilcox.testR에서 사용되는 통계 는 도움말 ( ?wilcox.test)에 정의되어 있으며 Mann-Whitney U 통계와의 관계에 대한 문제는 여기에 설명되어 있습니다.

문헌은 Wilcoxon 순위 합계 및 Mann-Whitney 테스트의 정의에 대해 만장일치가 아닙니다.

가장 일반적인 두 정의는 최소값을 빼거나 빼지 않은 첫 번째 샘플의 순위의 합에 해당합니다. R 빼기 및 S-PLUS는 그렇지 않습니다. 크기 m의 첫 번째 샘플. (윌 콕슨의 원래 논문은 조정되지 않은 순위의 합을 사용했지만 후속 표는 최소값을 뺀 것으로 보입니다.)

R의 값은 모든 쌍의 숫자로 계산 될 수 (x[i], y[j])있는 y[j]보다 크지 x[i]는 맨 - 휘트니 테스트의 가장 일반적인 정의.

이 마지막 문장은 질문의 측면에 완전히 답합니다. R이 내놓은 W의 버전은 U의 가치이기도합니다.

$\frac{n_1(n_1+1)}{2}$

— Glen_b-복귀 모니카
소스

Wilcoxon 순위 합 검정과 Mann-Whitney 검정은 모두 독립 t- 검정 의 비모수 적 동등 물입니다 . 어떤 경우에는 R이 제공하는 W의 버전은 U의 가치이기도하지만 모든 경우에 해당되는 것은 아닙니다.

사용시 : wilcox.test(df$var1 ~ df$var2, paired=FALSE)주어진 W는 U와 같습니다. 따라서 Mann-Whitney U 통계량으로보고 할 수 있습니다.

그러나 다음을 사용 wilcox.test(df$var1 ~ df$var2, paired=TRUE)하면 실제로 Wilcoxon 부호있는 순위 테스트를 수행하는 것입니다. Wilcoxon 부호있는 순위 테스트는 종속 t-test 와 같습니다 .

출처 : Andy Field (2013)의 "R을 사용한 통계 검색"

— 야프
소스

이 주장을 사용한다면 paired=TRUE그것은 윌 콕슨-맨-휘트니가 아니라 서명 된 순위 라는 것을 지적하는 것이 좋습니다 .

— Glen_b-복지 주 모니카

그러나 코드는 다음과 같습니다. wilcox.test(df$var1 ~ df$var2, paired=FALSE)( '~'사용)

다음과 다른 W 통계량을 생성합니다. wilcox.test(df$var1, df$var2, paired=FALSE)( ','사용)

— 타일 렌
소스

@Tilen 사이트에 오신 것을 환영합니다. 이것은 OP의 질문에 대한 답변, OP 또는 답변자 중 하나의 설명을 요청하는 의견 또는 자신의 새로운 질문으로 의도 되었습니까? "답변"필드 만 사용하여 원래 질문에 대한 답을 제공하십시오. 평판이 50보다 크면 어디에서나 댓글을 달 수 있습니다. 새로운 질문이 있으면 ASK QUESTION 페이지 상단의 회색 을 클릭하여 질문 하면 제대로 도와 드리겠습니다. 여기에 처음 오셨으므로 새로운 사용자를위한 정보가 포함 된 둘러보기 를 이용하십시오.

— gung-Monica Monica 복원

많은 감사 @gung. 실제로, 그것은 내가 생각하는 일종의 대답과 질문이었습니다. 팁 주셔서 감사합니다. 나는 이것의 일부가되기를 고대한다.

— Tilen

'답변'은 질문에 대한 직접적인 답변을위한 것입니다. 좀 더 순수하게 답변하기 위해 이것을 편집 할 수 있습니까?

— gung-복직 모니카

미안합니다. 나는 지금 그것을 편집했다. 이제 더 나아 보이나요?

— Tilen

사과 할 필요가 없습니다. 나는 당신이 여기에 넣은 것에 당신의 대답이 암시 적이라고 생각하지만 사람들은 줄 사이를 읽어야합니다. 당신은 그것을 명시 적으로 만들고 활로 묶을 수 있습니까? 그러나 이것이 옳지 않다. 수식 버전을 사용하려면 값으로 구성된 벡터와 그룹화 지표가 필요합니다. 예, wilcox.test(values~ind, with(df, stack(var1=var1, var2=var2)), paired=FALSE). 그렇게하면 W두 가지 방법 이 동일 합니다.

— gung-복직 모니카