Spearman 상관 관계가 Pearson보다 유한 한 양인 경우 무엇을 표시합니까?


12

관련 데이터 세트가 많이 있습니다. 쌍 간의 피어슨 상관 관계는 일반적으로 스피어 맨 상관 관계보다 확실히 큽니다. 그것은 어떤 상관 관계가 선형이라는 것을 암시하지만, 피어슨과 스피어 맨이 동일하더라도 기대할 수 있습니다. 피어슨과 스피어 맨 상관 사이에 명확한 간격이 있고 피어슨이 더 클 때 무엇을 의미합니까? 이것은 내 데이터 세트에서 일관된 기능인 것 같습니다.


답변:


14

Spearman 상관 관계는 실제 숫자 값 대신 순위 (순서 통계)를 사용하는 Pearson 상관 관계입니다. 귀하의 질문에 대한 답변은 그들이 같은 것을 측정하지 않는다는 것입니다. Pearson : 선형 추세, Spearman : 단조 추세 Pearson 상관 관계가 더 높다는 것은 선형 상관 관계가 순위 상관 관계보다 크다는 것을 의미합니다. 이는 분포의 꼬리에서 순위 값에 비해 큰 영향을 미치는 영향력있는 관찰 때문일 수 있습니다. Pearson 상관 관계를 사용한 연관성 테스트는 선형성이 데이터에서 유지 될 때 더 큰 검정력을 갖습니다.


1
나는 스피어 맨이 계급의 족장이라는 것을 알았습니다. 이 문제를 일으킬 수있는 다른 경로가 있는지 확인해야하지만 대량의 데이터보다 선형 적으로 상관 관계가 있지만 영향력으로 순위가 바뀌면 영향력을 잃는 영향력있는 꼬리 관측이 내가 무엇인지 분명히 알 수 있습니다. 봄.
John Robertson

0

Pearson 상관 관계는 다음과 같이 정확하다고 가정합니다. 1) 각 변수는 정규 분포입니다. 2) Homoscedasticity, 각 변수의 분산은 일정하게 유지됩니다. 그리고 3) 선형성, 관계를 나타내는 산점도는 회귀선 주위에 대칭 적으로 클러스터링 된 데이터 포인트를 나타냅니다.

Spearman Correlation은 관측의 순위에 따라 Pearson에 대한 비모수 적 대안입니다. Spearman Correlation을 사용하면 데이터 세트에 대한 세 가지 가정을 모두 완화하고 여전히 정확한 상관 관계를 도출 할 수 있습니다.

데이터에서 암시하는 것은 두 가정의 상관 관계가 크게 달라 지도록 언급 된 가정 중 하나 이상을 실질적으로 위반한다는 것입니다.

두 상관 관계 사이에 큰 차이가있는 경우 산포도 내에서 데이터 세트의 변수가 정규 분포, 동형 및 선형인지 여부를 조사해야합니다.

위의 조사는 Spearman 또는 Pearson 상관 계수가 더 대표적인 계수인지에 대한 결정을 용이하게합니다.


2

4
잘못되었습니다. Pearson 상관 관계에 대한 추론은 이러한 가정 중 어느 것도 유지할 필요가 없습니다. 이 분산, 비정규 데이터와 곡선 관계를 가질 수 있으며 Pearson 상관 테스트 (선형 회귀 모델에 대한 추론과 동일)는 1 차 추세를 감지하는 데 사용됩니다. 1 차 추세의 강도로서 Pearson 상관 관계의 해석은 여전히 ​​유효합니다. Pearson 상관 관계로 측정 된 1 차 추세가 분석에 적합하지 않은 경우는 거의 없습니다.
AdamO
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.