Mann-Whitney U-test : 효과 크기에 대한 신뢰 구간


13

Fritz, Morris, Richler (2011; 아래 참조)에 따르면 은 공식 r = z를 사용하여 Mann-Whitney U- 검정의 효과 크기로 계산할 수 있습니다. r 다른 경우에도r을 보고하기 때문에 이것은 나에게 편리합니다. 효과 크기 측정 값 외에도r의 신뢰 구간을보고하고 싶습니다.

r=zN
rr

질문 은 다음과 같습니다 .

  • 비모수 검정의 효과 크기 측정으로 사용되지만 피어슨의 r에 대한 r의 신뢰 구간을 계산할 수 있습니까?
  • 단측 테스트와 양측 테스트에 대해 어떤 신뢰 구간을보고해야합니까?

두 번째 질문에 대한 편집 : "단일 테스트와 양측 테스트에 대해 어떤 신뢰 구간을보고해야합니까?"

IMHO 가이 질문에 대답 할 수있는 더 많은 정보를 찾았습니다. "양측 신뢰 한계가 신뢰 구간을 형성하는 반면, 단측 대응 한계는 신뢰 하한 또는 상한이라고합니다." ( http://en.wikipedia.org/wiki/Confidence_interval ). 이 정보 를 바탕으로 중요도 테스트 (예 : -test)가 단측인지 양측인지에 대한 문제가 아니라 효과 크기에 대한 CI와 관련하여 어떤 정보를 원하는지 결론을 내 렸습니다 . 내 결론 (동의하지 않으면 저를 정정하십시오) :t

  • 양측 CI 상한 하한에 관심이 있습니다 (결과적으로, 특히 값이 근사치 인 경우 단측 유의 검정이 p <.05 임에도 불구하고 양측 CI에 0이 포함될 수 있습니다. 05.)
  • 단측 "CI" (이론적 추론으로 인해) 상한 또는 하한 에만 관심이 있습니다 . 그러나 이것은 지시 된 가설을 테스트 한 후에 반드시 주요 관심 대상이되는 것은 아닙니다. 초점이 효과 크기의 가능한 범위에있는 경우 양면 CI가 완벽하게 적합합니다. 권리?

위에서 언급 한 기사에서 Mann-Whitney 테스트의 효과 크기 추정에 대한 Fritz, Morris 및 Richler (2011)의 텍스트 구절은 아래를 참조하십시오.

"여기서 설명한 효과 크기 추정치의 대부분은 데이터가 정규 분포를 가지고 있다고 가정하지만 일부 데이터는 매개 변수 테스트의 요구 사항을 충족하지 않습니다 (예 : 서수이지만 구간 스케일이 아닌 데이터). 일반적으로 Mann-Whitney 및 Wilcoxon 검정과 같은 비모수 통계 검정으로 전환합니다.이 검정의 중요성은 표본 크기가 너무 작지 않은 경우 검정에 대한 검정 통계량 분포를 근사화하여 통계적으로 평가 합니다. 이러한 테스트는 적절한 실행보고 예로서 패키지 SPSS, Z에 대한 값에 더하여 값 U 또는 T ; ZzzUTz또한 수작업으로 계산할 수도 있습니다 (예 : Siegel & Castellan, 1988). 값을 예로서, 효과의 크기를 계산하는 데 사용될 수있는 R 코헨 (1988)에 의해 제안; r에 대한 Cohen의 지침은 큰 효과는 .5이고 중간 효과는 .3이며 작은 효과는 .1입니다 (Coolican, 2009, p. 395). r = z 이므로 이러한 z 값 에서 r , r 2 또는 η 2 를 쉽게 계산할 수 있습니다.zrrr2η2zr2

r=zN
이러한 효과 크기 추정값은 공식에 N이 있음에도 불구하고 샘플 크기와 독립적으로 유지됩니다. z는 샘플 크기에 민감하기 때문입니다. N의 함수로 나누면 결과 크기 결과에서 샘플 크기의 효과가 제거됩니다. "(12 페이지)
r2orη2=z2N

이 문서는 무료로 제공됩니다 .
asac

답변:


9

Mann-Whitney U 테스트의 효과 크기 중 하나는 공통 언어 효과 크기입니다. Mann-Whitney U의 경우 이는 명시된 가설을 뒷받침하는 표본 쌍의 비율입니다.

두 번째 선택은 순위 상관입니다. 순위 상관의 범위는 -1에서 +1까지이므로 Pearson r과 유사한 속성을 갖습니다. 또한, 간단한 차이 공식에 의해 순위 상관 관계는 공통 언어 효과 크기와 그 보완 사이의 차이, 해석을 촉진시키는 사실입니다. 예를 들어 100 개의 표본 쌍이 있고 70 개의 표본 쌍이 가설을 지원하는 경우 공통 언어 효과 크기는 70 %이며 순위 상관 관계는 r = .70 = .30 = .40입니다. Kerby는 Innovative Teaching : Kerby (2014) Innovative Teaching 저널에서 공통 언어 효과 크기와 순위 상관 관계를 계산하기위한 4 가지 공식에 대해 명확하게 설명합니다.

그건 그렇고, 논문에서 언급하지는 않지만, Somer d와 Mann-Whitney의 순위 상관 관계가 동일하다는 것을 확신합니다.


1
"예를 들어 100 개의 가능한 쌍이있는 경우"를 의미 합니까? Mann-Whitney U-test는 짝을 이루지 않은 데이터에 대한 것이기 때문에 문구가 모호합니다. 독자에게 가능한 쌍이 무엇인지 명확히하고 싶을 수 있습니다.
gung-복직 모니카

1
의견과 명확하게 설명해 주셔서 감사합니다. 샘플 쌍을 언급했습니다 . 실험 샘플에 10 개의 관측치가 있고 대조 샘플에 10 개의 관측치가있는 경우 10 * 10 = 100 개의 샘플 쌍이 있습니다. Robert Grissom에 따르면 표본의 효과 크기는 모집단 효과 크기의 편향 추정량입니다. 따라서 표본에 대한 순위 상관이 r = .40이면 모집단 효과 크기의 편향 추정량입니다.
DSK

나는 그것이 당신이 의미하는 것으로 의심했습니다, @DSK. 나는 그 설명이 사람들에게 도움이 될 것이라고 생각합니다. 당신은 당신의 답변에 그것을 편집 할 수 있습니다. 이력서에 오신 것을 환영합니다.
gung-모니 티 복원

8

귀하의 링크를 통해 기사를 구매할 수 있습니다.

cHmiscrcorr.censcDxyDxy=2×(c12)


이것을 내 통지 (링크)로 가져 주셔서 감사합니다. 나는 지금 내 질문에 Mann-Whitney 테스트에 대한 구절을 삽입했습니다.
회색

대답 해 주셔서 감사합니다. c-index와 Somers 'D를 해석하는 방법에 대한 링크가 있습니까? 나는 후자가 r에 필적하는 것으로 해석 될 수 있는지에 특히 관심이 있습니다. 두 개의 표본이 있고 두 번째 표본 (더 큰 N 및 정규 분포)에서 r을보고합니다. 물론 사용 된 측정 값이 비슷하다면 결과를 쉽게 비교할 수있을 것이라고 생각합니다. 이것이 Fritz et al.에 언급 된 공식에 관심이있는 이유입니다. (2011). 그래서 그들의 r에 대한 CI는 Pearson의 r에 대해 계산할 수 없습니까? 다시 한번 감사드립니다!
회색

zDxyYDc

답변 해 주셔서 감사합니다. 나는 Somer를 해석하는 방법에 대한 더 많은 정보를 찾았지만 지금까지는 성공하지 못했습니다. Somer의 d는 Pearson의 상관 계수와 유사하게 이해 될 수 있습니까? 예를 들어,이를 제곱하면 결정 계수가 산출됩니까? r과 비슷하게 해석 할 수있는 효과 크기 측정 값을 찾으면 매우 기쁩니다.
회색

공식 r = Z / √ (N)에 대한 더 많은 정보를 찾았습니다. Rosenthal (1991)은 "우리가 연구의 크기 (N)를 아는 한 ap 수준에서만 효과 크기 r을 유용하게 추정 할 수 있다고 썼습니다. 우리는 Z 값 표를 사용하여 얻어진 p를 표준 정규 편차 이탈로 변환합니다. "
회색
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.