켄달 타우 또는 스피어 맨의 rho?


69

어떤 경우에는 다른 것을 선호해야합니까?

나는 교육적인 이유로 Kendall에게 유리하다고 주장하는 사람 이 다른 이유가 있다는 것을 발견했습니다 .


관련 질문 stats.stackexchange.com/q/18112/3277 도 참조하십시오 .
ttnphns

1
불행히도, 귀하의 질문에 대한 링크가 죽었습니다. 나는 당신이 Noether (2007, Teaching Statistics )를 참조한다고 가정합니다 . 편집 하시겠습니까?
Stephan Kolassa

답변:


40

Spearman 상관 관계는 측정 점수에서 정수 값 점수로 작업 할 때, 가능한 점수가 적당하거나 이변 량 관계에 대한 가정에 의존하고 싶지 않을 때 보통 선형 상관 관계 대신 주로 사용됩니다 . Pearson 계수와 비교할 때 Kendall의 타우 해석은 가능한 모든 페어 단위 이벤트 간의 일치 및 불일치 쌍의 % 차이를 정량화한다는 점에서 Spearman의 rho에 대한 해석보다 덜 직접적 인 것처럼 보입니다. 내 이해에 따르면 Kendall의 타우는 Goodman-Kruskal Gamma 와 더 유사합니다 .

방금 J. Statistics Educ에서 Larry Winner의 기사를 찾아 보았습니다. (2006) 은 1975-2003 년 NASCAR Winston Cup Race Results 두 가지 방법의 사용에 대해 논의합니다 .

또한 Pearson 또는 Spearman의 비정규 데이터와의 상관 관계 에 대한 @onestop 답변 이 흥미 롭습니다.

참고로, Kendall 's tau ( a 버전)는 예측 모델링에 사용되는 Somers 'D (및 Harrell 's C)와 연결되어 있습니다 (예 : RB Newson의 4 가지 간단한 모델 과 그 참조 6 , Newson의 기사에서 Somers'D의 해석 참조) Stata Journal 2006에 게재 됨). 순위 합계 테스트에 대한 개요 는 JSS (2006)에 발표 된 순위 통계에 대한 잭나이프 신뢰 구간의 효율적인 계산 에서 제공됩니다 .


답변을 주셔서 감사합니다. 나는 그 범위에 동의했습니다. Best, Tal
Tal Galili

Spearman은 두 개의 정수 변수를 사용하여 관계를 정기적으로 비교합니다 .Kendall의 tau가 더 잘 처리하는 것처럼 보입니다.
vinnief

29

나는에 존경하는 신사를 참조 내 이전의 대답은 "... 스피어의 r에 대한 신뢰 구간 : S는 켄달 & 기븐스 (1990)에 따르면, 덜 안정적이고 켄달의 τ-매개 변수에 대한 신뢰 구간보다 해석 할 수 있습니다."


1
로저 뉴슨에게 감사의 말을 전합니다.
onestop

22

다시 다소 철학적 답변; 기본적인 차이점은 Spearman 's Rho는 비선형 상호 작용에 대해 R ^ 2 (= "분산 설명") 아이디어를 확장하려는 시도이며 Kendall의 Tau는 비선형 상관 테스트에 대한 테스트 통계가 될 것입니다. 따라서 Tau는 비선형 상관 관계를 테스트하기 위해 Rho를 R 확장으로 사용하거나 R ^ 2에 익숙한 사람들에게 사용해야합니다.


6
"비선형 상호 작용"을 설명해 주시겠습니까? Spearman Rho는 심리학 측면에서 유효성 계수의 측정치를 반영하는 것 같습니다. 나는 타우의 본질에 대해 모른다.
Subhash C. Davar

귀하의 의견의 심리 측정 내용을 이해하지 못합니다.
Léo Léopold Hertz 준영

1
xx2

1
x가 음수가 아닌 경우에만 해당됩니다.
aocall

17

다음 은 이론적 인 이유로 Spearman의 ρ에 대한 Kendall의 τ 를 옹호하는 Andrew Gilpin (1993)의 인용입니다 .

"[켄달 ]보다 빠르게 정규 분포에 가까워 로서, , 샘플 크기가 증가하고, 관계가 존재하는 경우 특히 더 다루기 쉬운 수학적도이다." τ N τρNτ

참고

아칸소 길핀 (1993). 메타 분석에 대한 효과의 크기 측정치 내에서 Kendall 's Tau를 Spearman 's Rho로 변환하기위한 표. 교육 및 심리 측정, 53 (1), 87-92.


3

FWIW, Myers & Well의 인용문 (연구 디자인 및 통계 분석, 제 2 판, 2003, p. 510). 여전히 p- 값에 관심이 있다면;

Seigel과 성주 (1988, 행동 과학 비모수 통계)는 비록 지적 및 스피어 동일한 데이터 세트에 대해 계산 된 경우에 대한 의미를 테스트 할 때, 일반적으로 서로 다른 값을 가질 것이다 및 스피어 에 기초 샘플링 분포는 동일한 p- 값을 산출합니다 .ρ τ ρτρτρ


그들이이 주장에 대해 어떤 지원을 제공하는지 알고 있습니까? 나는 그것이 일반적으로 사실 일 수있는 방법을 보지 못합니다 (그들은 종종 비슷할 수도 있지만, 그들이 똑같은 주장이 어떻게 견딜 수 있는지는 실제로 알지 못합니다). [Siegel과 Castellan이 실제로 정확히 말한 것인지 조금 다른 것이 있는지 궁금합니다.]
Glen_b

Siegel & Castellan (2ed p253)을 확인했습니다. 그들은 약간 다른 것을 말하지만 ... "대략"을 추가하더라도 실제로는 위의 문구보다 약간 더 나쁩니다 (null 아래의 경우로 제한하기 때문에 데이터에 집중하기 때문에 더 나쁩니다) 어쨌든, 의 고정 된 순서의 경우 , 가능한 모든 순위 순서는 H0에서도 동일하게 발생합니다.) 데이터에 대한 조정 후 널에 대한 조정이 중요하다고 생각한다는 사실은 걱정입니다. 그들이 다른 말을하려고했는지 또는 정말로 오해를하는지 궁금합니다.yxy
Glen_b

반례로서, n = 7과 정확한 p- 값을 취하십시오. x = 1,2,3,4,5,6,7이고 y = 2,1,4,3,7,6,5하자 ... 스피어 맨은 p = 0.048, Kendall은 0.136을줍니다 ... 전혀 같지 않습니다. 다른 배열은 kendall에 동일한 값을 제공하지만 스피어 맨의 p = 0.302입니다. 이러한 많은 예제와 다양한 샘플 크기가 있습니다
Glen_b

3
다음은 n = 8 사례에 대한 도표입니다. 보시다시피 두 상관 관계 측정치에 대한 p- 값 사이에는 많은 차이가 있습니다. i.stack.imgur.com/5JMbj.png ... 이것에 대한 Q & A를 작성할 수 있습니다
Glen_b

1
다음은 Spearman 상관 p- 값이 동일하지만 Kendall 상관 p- 값이 매우 다른 두 가지 경우 (이번 n = 9 인 경우)를 나타내는 두 가지 데이터 세트 (순위 지정 후)입니다. i.stack.imgur. com / 3ILD8.png
Glen_b
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.