Wilcoxon 사인 랭크 테스트에 대한 효과 크기?

일부 저자 (예 : Pallant, 2007, p. 225; 아래 이미지 참조)는 검정 통계량을 관측치 수의 제곱근으로 나누어 Wilcoxon 부호있는 순위 검정의 효과 크기를 계산하도록 제안합니다.

$r = \frac{Z}{\sqrt{n_x + n_y}}$

ZSPSS (아래 이미지 참조) 및 wilcoxsign_testR 의 테스트 통계 출력입니다 (내 관련 질문 : wilcoxsign_test의 teststatistic vs linearstatistic 참조 )

다른 사람들은 Bravais-Pearson ( $r = \ frac {cov (XY)} {sd (X) \ times sd (Y)}$ ) 또는 Spearman ( $r_S$ ) 상관 계수 (데이터 유형에 따라 다름)를 제안합니다. $r = \frac{cov(XY)}{sd(X) \times sd(Y)}$ ) or Spearman ( $r_S$ ) correlation coefficients (depending on data type).

그것들을 계산할 때 두 rs는 원격으로 동일하지 않습니다. 예를 들어, 현재 데이터의 경우 :

r = 0.23 ( $r = \ frac {Z} {\ sqrt {n_x + n_y}}$ ) $r = \frac{Z}{\sqrt{n_x + n_y}}$ )

r = 0.43 (피어슨)

이것들은 상당히 다른 효과 크기를 암시합니다.

그렇다면 올바른 효과 크기는 무엇이며, 두 효과는 서로 어떻게 r관련이 있습니까?

Pallant, J. (2007)의 224 쪽 (하단부) 및 225 쪽. SPSS 생존 매뉴얼 :

여기에 이미지 설명을 입력하십시오

effect-size wilcoxon-signed-rank

— 커뮤니티
소스

아, 아마 그럴 것 같습니다 .

— Glen_b-복지 주 모니카

Bravais가 한 언어로 크레딧을 받아야 할 경우 다른 언어로도 가치가 있습니다! 교육에 차이가 생기는 것에 감사드립니다.

— Glen_b-복지 주 모니카

그렇습니다. 타이를 다룰 수있는 테스트가 필요하기 때문입니다.

위의 의견에서 인용 한 책 (Pallant, 2007, p. 225)의 지시에 따르면 nin 은 모든 관측치의 수, 즉 두 벡터의 길이의 합입니다. 즉, 참가자 수가 아닌따라서 공식은 동일하므로 "n"의 의미 만 정확하게 이해하면됩니다. 그것이 틀렸다면, 저를 교육하십시오. 이것은 결국 내 질문의 목표입니다.

\sqrt{n}

$\sqrt{n}$

n = n_{x} + n_{y}

$n = n_x + n_y$

개인적으로 Z / sqrt (n)가 하나의 옵션이라고 생각했습니다. Mann-Whitney의 Wikipedia는 Kirby의 pdf 논문과 연결되며 Wilcoxon 과도 관련이 있습니다. 나는 그 기사를 읽지 않았다.

— ttnphns

답변:

동점이 없으면 해당하는 이전 값보다 작은 이후 값의 비율을보고합니다.
동점이있는 경우, 묶이지 않은 총 쌍 수보다 이전보다 작은 이후 값의 비율을보고하거나 세 비율 (<, =,>)과 둘 중 하나의 합계를보고 할 수 있습니다. 더 의미있는. 예를 들어, '33 %는 통계에 대한 두려움이 적었고, 57 %는 변경되지 않았으며, 10 %는 코스 후 90 %가 이전과 같거나 더 좋았습니다.

$N$ $z$ $\sqrt N$ $z/\sqrt N$ $z/\sqrt N$

그러나 다른 주름이 있습니다. 전체 효과의 크기를 추정하고 싶지만 사람들은 일반적으로 서수 인 데이터로 Wilcoxon 부호있는 순위 테스트를 사용합니다. 즉, 데이터가 학생 내에서의 교대 규모를 확실하게 나타낼 수 있다고 믿지 않지만 교대가 발생했다는 것입니다. 그것은 위에서 설명한 비율로 나에게 가져옵니다.

반면에 값이 본질적으로 의미가 있다고 신뢰하는 경우 (예 : 정규성 및 특이 치에 대한 견고성에 대해 부호있는 순위 테스트 만 사용) 원시 평균 또는 중간 차이 또는 표준화 된 평균 차이 만 사용할 수 있습니다. 효과의 척도로.

— gung-복직 모니카
소스

+1 제안 된 효과 측정법은 이해하기 쉽고 테스트 통계와도 관련이 있습니다.

— John

어떤 종류의 데이터가 평가되고 있는지 알지 못하면 좋은 조언을하기가 매우 어렵습니다. 그리고 정말로, 당신이 얻을 수있는 전부입니다. 이런 질문에 대한 효과 크기를 측정하는 가장 좋은 방법은 없습니다.

질문에 언급 된 효과 크기는 모두 표준화 된 효과 크기입니다. 그러나 원래 조치의 수단 또는 중간 정도가 괜찮을 수도 있습니다. 예를 들어, 제조 공정이 완료되는 데 걸리는 시간을 측정하는 경우 시간 차이는 완벽하게 합리적인 효과 크기 여야합니다. 공정, 향후 측정, 시스템 측정, 공장 측정 등 모든 변경 사항이 제 시간에 완료됩니다. 아마도 평균을 원하거나 중간 또는 심지어 모드를 원할 수도 있지만, 가장 먼저해야 할 일은 실제 측정 척도를보고 효과 크기가 측정하기에 합리적이고 강력하게 연결되어 있는지 확인하십시오.

그것에 대해 생각하는 데 도움을주기 위해 표준화되어야하는 효과는 더 간접적으로 그리고 여러 방법으로 측정되는 것입니다. 예를 들어, 심리적 척도는 시간이 지남에 따라 다양한 방법으로 변할 수 있으며 직접 평가되지 않는 기본 변수에 도달하려고 시도합니다. 이러한 경우 표준화 된 효과 크기를 원합니다.

표준화 된 효과 크기를 사용하면 중요한 문제는 사용하는 것이 아니라 의미하는 것입니다. 당신이 당신의 질문에 암시하는 것처럼, 당신은 또한 그들이 무엇을 의미하는지 알지 못하며 그것이 중요한 것입니다. 표준화 된 효과가 무엇인지 모르는 경우 올바르게보고하거나 올바르게 해석하거나 올바르게 사용할 수 없습니다. 또한, 데이터에 대해 논의하고자하는 다양한 방법이있는 경우 하나 이상의 효과 크기를보고하는 데 방해가되지 않습니다. 제품 모멘트 상관 관계와 같은 선형 관계 또는 Spearman과의 순위 관계와 관련하여 데이터를 논의 할 수 있습니다.r그리고 그 차이점 또는 표의 모든 정보를 제공하십시오. 전혀 문제가 없습니다. 그러나 무엇보다 원하는 결과를 결정해야 할 것입니다. 그것은 주어진 정보에서 대답 할 수 없으며 이런 종류의 포럼에서 질문하기에 합당한 것보다 훨씬 더 많은 정보와 도메인 특정 지식을 요구할 수 있습니다.

효과를보고하는 방법에 대해 항상 메타 분석적으로 생각하십시오. 앞으로 사람들이 내가보고 한 결과를 다른 사람과 통합 할 수 있습니까? 아마도 당신 분야에는 이런 것들에 대한 표준이있을 것입니다. 아마도 비모수 적 테스트를 선택했을 것입니다. 다른 사람들이 기본 분포에 대해 내린 결론을 신뢰하지 않고 주로 모수 테스트를 사용하는 필드에서 가정을 더 보수적으로 원하기 때문입니다. 이 경우 일반적으로 파라 메트릭 테스트에 사용되는 효과 크기를 추가로 제공해도 아무런 문제가 없습니다. 유사한 연구에 대한 더 큰 문헌에서 연구 결과를 어떻게 배치 할 것인지 생각할 때 이러한 문제와 다른 많은 문제를 고려해야합니다. 일반적으로 좋은 설명 통계는 이러한 문제를 해결합니다.

이것이 기본 조언입니다. 추가 의견이 있습니다. 효과 크기가 테스트와 밀접하게 관련되기를 원한다면 Z기반 권장 사항이 가장 좋습니다. 표준화 된 효과 크기는 테스트와 같은 의미입니다. 하지만 그렇게하지 않으면 d파라 메트릭 테스트와 관련된 Cohen과 같은 다른 것만 사용해도 아무 문제가 없습니다 . 평균, 표준 편차 또는 평균 계산에 대한 정규 가정이 없습니다.d점수. 실제로 권장 상관 계수보다 약한 가정이 있습니다. 그리고 항상 좋은 설명 방법을보고하십시오. 다시 말하지만, 서술 적 조치에는 위반하려는 가정이 없지만 실질적인 의미를 명심하십시오. 데이터에 대해 말하고 싶은 말과 의미와 중간 값이 다른 것을 말하는 설명 통계를보고합니다.

반복 된 측정 값과 독립된 디자인 효과 크기에 대해 논의하려면 완전히 새로운 질문입니다.

— 남자
소스