Goodman-Kruskal 감마와 Kendall tau 또는 Spearman rho 상관 관계는 어떻게 비교됩니까?


31

내 연구에서는 일부 데이터 집합에 대해 예측 순위와 실제 순위를 비교하고 있습니다. 최근까지 우리는 Kendall-Tau 만 사용했습니다. 비슷한 프로젝트를 진행하는 한 그룹은 우리가 대신 Goodman-Kruskal Gamma 를 사용하려한다고 제안 했고 그들은 그것을 선호했습니다. 다른 순위 상관 알고리즘의 차이점이 무엇인지 궁금했습니다.

내가 찾은 최선의 결과는 Spearman이 일반적인 선형 상관 관계 대신 사용되며 Kendall-Tau가 덜 직접적이고 Goodman-Kruskal Gamma와 더 유사하다고 주장하는 이 답변 이었습니다 . 내가 작업하고있는 데이터는 명백한 선형 상관 관계가없는 것처럼 보이며 데이터가 크게 왜곡되고 비정규 적입니다.

또한 Spearman은 일반적으로 데이터에 대해 Kendall-Tau보다 높은 상관 관계를보고하며 데이터에 대해 구체적으로 무엇을 말하는지 궁금합니다. 나는 통계학자가 아니기 때문에 내가 읽은 논문들 중 일부는 저에게 전문 용어처럼 보입니다. 죄송합니다.


3
" Spearman은 일반적으로 데이터에 대해 Kendall-Tau보다 더 나은 상관 관계를보고합니다. 데이터에 대해 무엇을 말하는지 궁금합니다 . Kendall 는 상관 관계가 실제로 또는 가깝지 않을 때 Spearman의 보다 0에 가깝습니다 .-연관성을 다르게 측정합니다. 일반적으로 크기가 작다는 것은 Spearman 상관 관계가 '더 나은'것을 의미하지는 않습니다. 그들은 단지 데이터에 대해 다른 것들을 측정하고 있습니다. '더 나은 상관 관계'라고 말하는 것은 무엇입니까? τ0 ± 1ρ0±1
Glen_b-복지 주 모니카

1
그것은 내 질문 @Glen_b와 간접적으로 동일했습니다. 알고리즘이 더 높은 상관 관계를보고 한 이유와 그 원인을 묻습니다. 내 의미를 좀 더 명확하게하기 위해 "더 나은"을 "높은"로 변경하겠습니다. 당신은 그들이 다른 것을 측정하고 숫자가 실제로 서로 관련이 없다고 생각하지만, 숫자가 실제로 무엇을 의미하는지 알고 싶었습니다. 이는 아래에 자세히 설명되어 있습니다.
Poik

답변:


29

스피어 맨로 vs 켄달 타우 . 이 두 가지는 계산적으로 매우 다르므로 그 크기를 직접 비교할 수 없습니다 . Spearman은 일반적으로 1/4에서 1/3까지 높으며 이는 Spearman이 특정 데이터 세트에 대해 "더 나은"것으로 잘못 결론지었습니다. rho와 tau의 차이는 이데올로기, rho의 분산 비율 및 tau의 확률 에 있습니다. Rho는 순위가 매겨진 데이터에 적용되는 일반적인 Pearson r이며 r과 같이 작은 모멘트가있는 점보다 모멘트가 큰 점 (즉, 구름 중심과의 편차)에 더 민감합니다. 따라서 rho는 순위 후 구름의 모양에 매우 민감합니다.완료 : 장방형 마름모꼴 구름에 대한 계수는 장음 덤벨 구름에 대한 계수보다 높습니다 (첫 번째 모서리의 날카로운 모서리가 큰 순간이기 때문). 타우는 감마의 확장이며 모든 데이터 포인트에 똑같이 민감 하므로 순위가 매겨진 구름의 모양에 덜 민감합니다. 타우는 rho보다 "일반적"입니다. rho는 변수 간의 기본 (모형 또는 기능적) 관계가 엄격하게 단조 적이라고 생각할 때만 보증됩니다. Tau는 비단 조 기본 곡선을 허용하고 양수 또는 음수의 단조로운 "추세"가 전반적으로 우세한 것을 측정합니다. Rho는 r의 크기와 비슷하다; 타우는 아닙니다.

켄달 타우는 감마 . 타우는 감마의 표준화 된 형태 일뿐입니다. 여러 관련 측정 값에는 모두 분자 있지만 정규화 분모가 다릅니다 .

  • 감마 : +
  • Somers 'D ( "x 의존") : ++엑스
  • Somers 'D ( "y dependent") : ++와이
  • Somers 'D ( "symmetric") : 위 두 값의 산술 평균
  • 켄달의 타 우비 (정사각형 테이블에 가장 적합) :이 둘의 기하 평균
  • 켄달의 타우 씨 (사각형 테이블에 가장 적합) : 2(케이1)/(2케이)
  • 켄달의 타 우아 (넥타이에 대한 nо 조정) : (1)/2=++엑스+와이+엑스와이

여기서 "동일성"을 갖는 관측 쌍의 수, Q- "반전"을 가진; T x- 변수 X에 의한 타이의 수, T y- 변수 Y에 의한 T x y – 두 변수에 의한 것; N- 관측치 수, k- 이 수가 적은 변수의 고유 값 수엑스와이엑스와이케이

따라서 tau는 감마와 이론 및 규모가 직접 비교됩니다. Rho는 Pearson 과 이론과 규모가 직접 비교됩니다 . Nick Stauner의 좋은 답변은 rho와 tau를 간접적으로 비교하는 방법을 알려줍니다.아르 자형

tau 및 rho 도 참조하십시오 .


14

이론적 인 이유로 스피어 맨의 ρ에 대한 Maurice Kendall의 를 옹호하는 Andrew Gilpin (1993)의 인용문은 다음과 같습니다 .τρ

[켄달 ]보다 더 빠르게 정규 분포에 가까워 ρ 로서, N , 샘플 크기 증가; τ 는 수학적으로 더 다루기 쉬우 며 특히 넥타이가있을 때 더욱 그렇습니다. τρNτ

Goodman-Kruskal 에 대해 많이 추가 할 수는 없습니다. 단 , 최근에 작업 한 설문 조사 데이터 샘플에서 Kendall의 τ 보다 약간 더 큰 추정치를 생성하는 것 같습니다. Spearman 's ρ 보다 더 낮은 추정치 . 그러나 몇 개의 부분 γ 추정값을 계산하려고 시도했는데 (Foraita & Sobotka, 2012), 부분 τ 보다 부분 ρ에 더 가깝게 나왔습니다. 하지만 처리 시간이 많이 걸렸습니다. 다른 사람과의 시뮬레이션 테스트 또는 수학적 비교 ... (그 방법을 아는 사람은 ...)γτργρτ

으로 ttnphns는 의미, 당신은 당신의 결론 수 없습니다 추정이 더 나은보다 τ 자신의 비늘 (한계가 아니더라도) 다르기 때문에, 혼자 규모로 추정하고있다. Gilpin은 ρτ 의 비율을 대부분의 값 범위에서 대략 1.5 로 설명하면서 Kendall (1962)을 인용 합니다. 크기가 증가함에 따라 점진적으로 가까워 지므로 둘 다 1 (또는 -1)에 가까워 질수록 차이는 무한대가됩니다. 길핀은 ρ , r , r 2 , d , Z r 에 해당하는 τ에 대한 세 번째 숫자까지 큰 값을 제공합니다.ρτρτρ아르 자형아르 자형2아르 자형τ인트로 통계 교과서의 표지 내부에서 볼 수 있듯이 범위 내에서 .01 씩 증가 할 때마다 그는 다음과 같이 있습니다 켄달의 특정 공식에 해당 값을 기반 : (나는Gilpin이 쓴 양식에서 Pearson의r과 관련하여이 공식을ρ로단순화했습니다.)

아르 자형=(τπ2)ρ=6π(τ아크 신((τπ2)2))
ρ아르 자형

아마 감각을 만들 것입니다 귀하의 변환 ρτρ 및 계산 변경하여 효과 크기 추정에 미치는 영향을 참조하십시오. 비교는 Spearman의 가 더 민감한 문제가 데이터에 존재 하는 정도를 어느 정도 나타내는 것으로 보입니다 . 각 특정 문제를 개별적으로 식별하기위한보다 직접적인 방법이 반드시 존재합니다. 내 제안은 그 문제에 대해 더 빠르고 더러운 옴니버스 효과 크기를 더 많이 만들 것입니다. 차이가 없으면 (척도 차이를 수정 한 후) ρ 에만 적용되는 문제를 더 이상 찾을 필요가 없다고 주장 할 수 있습니다.ρρ. 상당한 차이가 있다면, 아마도 책임있는 것을 결정하기 위해 돋보기 렌즈를 깰 때입니다.

Kendall의 사용할 때 사람들이 일반적으로 효과 크기를보고하는 방법을 잘 모르겠습니다 (유감스럽게도 사람들이 일반적으로 효과 크기를보고하는 것에 대해 걱정하는 정도는 제한적입니다). 그러나 익숙하지 않은 독자는 Pearson r , 위의 변환 공식을 사용 하여 τ 통계량과 r 의 척도에 대한 효과 크기를 모두보고하는 것이 현명수 있습니다 ... 적어도 규모의 차이를 지적하고 편리한 변환 테이블을 위해 Gilpin에게 소리 지르십시오. .τ아르 자형τ아르 자형

참고 문헌

Foraita, R. & Sobotka, F. (2012). 그래픽 모델의 유효성 검사 gmvalid 패키지, v1.23. 종합적인 R 아카이브 네트워크. URL : http://cran.r-project.org/web/packages/gmvalid/gmvalid.pdf

아칸소 길핀 (1993). 메타 분석에 대한 효과의 크기 측정치 내에서 Kendall 's Tau를 Spearman 's Rho로 변환하기위한 표. 교육 및 심리 측정, 53 (1), 87-92.

MG Kendall (1962). 순위 상관 방법 (제 3 판). 런던 : 그리핀.


9

ρτγγτXYγX1X2YXXXγ


2
프랭크, 가능하면 Spearman's ρ is related to the probability of majority concordance among random triplets of observations수학적으로 어렵지 않은 자세한 내용 을 설명해 주 시겠습니까? 감사.
ttnphns

1
수년 전에 비모수 통계 텍스트에서 읽었습니다. 참조를 찾을 수 없습니다.
Frank Harrell

1
불행히도 ... :-( 진술 자체가 매우 흥미
롭기
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.