Mann-Whitney 테스트는 어떻게보고합니까?


10

논문을 작성 중이며 여러 가지 테스트를 수행하고 있습니다. Kruskal–Wallis 테스트를 사용한 후 보통 다음과 같이 결과를보고합니다.

의 평균 사이에 상당한 차이 가 있습니다.(χ(2)2=7.448,p=.024)

그러나 지금은 Mann-Whitney 테스트를 실시했는데 어떤 값을 제시해야할지 모르겠습니다. SPSS는 Mann-Whitney , Wilcoxon , 및 값을 제공합니다. 이 4 가지 값을 모두 제시합니까? 아니면 관련이 없습니까?W Z PUWZP

답변:


12

Wikipedia에 귀하의 답변이있는 것 같습니다. 다음은 예제 결과 문에서 발췌 한 내용입니다.

Mann-Whitney 테스트 결과를보고 할 때 다음을 언급하는 것이 중요합니다.

  • 두 그룹의 중심 경향 측정 (평균 또는 중간 값; Mann-Whitney는 순서 테스트이므로 중간 값이 일반적으로 권장 됨)
  • U 의 가치
  • 샘플 크기
  • 유의 수준.

실제로이 정보 중 일부는 이미 제공되었을 수 있으며 반복 여부를 결정할 때 상식을 사용해야합니다. 일반적인 보고서가 실행될 수 있습니다.

"그룹 E와 C의 중간 지연 시간은 153과 247ms였으며 두 그룹의 분포는 크게 달랐습니다 (Mann-Whitney U = 10.5, n 1 = n 2 = 8, P <0.05 양측)."

윌 콕슨 부호 순위 테스트는 맨 - 휘트니 테스트는 독립적 인 샘플을 가정하는 반면, 쌍 샘플에 적합하다. 그러나 Field (2000) 에 따르면 SPSS 출력 의 Wilcoxon 는 "이 통계의 다른 버전으로, Z 점수로 변환 될 수 있으므로 정규 분포의 임계 값과 비교할 수 있습니다"라고합니다. 그러면 점수도 설명됩니다 !zWz

참고로 Wikipedia 는 큰 표본의 경우 가 대략 정규 분포되어 있다고 덧붙입니다 . 이러한 모든 값이 주어지면 효과 크기 계산할 수 있으며 , Wikipedia의 예에서는 0.319입니다 (계산기는 11 항 에서 구현 됨 ). 그러나이 테스트 통계량의 변환은 대략적인 정규성에 따라 달라 지므로 n s = 8에서는 정확하지 않을 수 있습니다 ( Fritz et al., 2012 ) .Uη2U

PS Kruskal–Wallis 검정의 결과는 특별한 상황을 제외하고는 평균 간의 차이를 나타내는 것으로 해석되어서는 안됩니다. 자세한 내용은 " Anna 와 Kruskal-Wallis 테스트의 차이점"에 대한 다른 질문에 대한 @Glen_b의 답변을 참조하십시오.

참고 문헌

Field, A. (2000). 3.1. 만 휘트니 테스트. 연구 방법 1 : Windows 용 SPSS 3 부 : 비모수 적 테스트. http://www.statisticshell.com/docs/nonparametric.pdf 에서 검색했습니다 .
Fritz, CO, Morris, PE 및 JJ Richrich (2012). 효과 크기 추정 : 현재 사용, 계산 및 해석. 실험 심리학 저널 : 일반 , 141 (1), 2–18. 를 통해 사용할 수 PDF 리서치 게이트 .


3
위의 예에서 U 값을보고하는 요점은 무엇입니까? 독자로서 U가 10.5라는 것을 알면 무엇을 얻을 수 있습니까?
amoeba

4
위의 예에서 정확한 를 계산할 수있는 능력을 얻습니다.이 값 은 제공되지 않으며 효과 크기 추정, 메타 분석 또는 해킹 확인에 유용 할 수 있습니다 . 내 @rpierce의 친구이자 동료는 나에게 잘못 알려진 테스트 통계 및 관련 를 통해 잘못 게시 된 많은 기사를 잡았 기 때문에 독자가 내가 올바르게 일을하고 있는지 확인하기 위해 테스트 통계를보고하도록 조언 했습니다 . ppdf
Nick Stauner

흥미 롭군 나는이 문제가 별도의 질문에 합당 할 수 있다고 생각합니다. 여전히 : 정확한 p- 값을 원한다면 정확한 p- 값을보고 할 수 있습니다! 실제로 일반적인 조언은 p <0.0001과 같이 매우 작지 않은 한 정확한 p- 값을보고하는 것입니다. 그러나이 경우 p- 해킹은 거의 없습니다. 그리고 효과 크기는 어쨌든 위키에서 인용 한 "E 및 C 그룹의 중간 대기 시간은 153 및 247 ms"와 같이 별도로보고해야합니다.
amoeba

1
우리 알마 교인의 심리학자를위한 비밀 (즉, 검색 불가능한) Facebook 그룹 예제가 포함되어 있지 않습니다. 그래도 궁금합니다. 어쩌면 당신은 별도의 질문에 그를 태그하면 그를 공유 할 수 있습니다. ! " 와 효과 크기 외에 테스트 통계를보고하는 것이 왜 중요한가?"와 같은보다 기본적인 질문은 확실합니다. 제가 생각하지만 온 주제가 될 것입니다 ... 세 이하 중복에 대한 확인 보고 태그 첫번째하지만, 당신이 정말 안전하려면 ...p
닉 Stauner

1
표본 크기가 너무 작아 잘못 해석되지 않을 경우 독자는 직관적 인 감각을 갖기 때문에 표준화 된 U 또는 W (표준화, 동일)를 Z- 값 ( )과 동일하게보고하려고합니다. 그러나 의미하는 바는 무엇입니까? 그러나 통계에 대한 Z 점수를 기반으로 한 것이 아니라 정확한 p- 값이있을 때 명확해야합니다. ZU
Glen_b-복지 주 모니카
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.