몇 가지 예를 실행했을 때 rho 및 피어슨 순위의 t- 검정에 대한 p- 값은 항상 일치합니다. 마지막 몇 자리를 저장하십시오.
그럼 당신은 잘못된 예제를 실행했습니다!
a = c(1,2,3,4,5,6,7,8,9)
b = c(1,2,3,4,5,6,7,8,90)
cor.test(a,b,method='pearson')
Pearson's product-moment correlation
data: a and b
t = 2.0528, df = 7, p-value = 0.0792
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.08621009 0.90762506
sample estimates:
cor
0.6130088
cor.test(a,b,method='spearman')
Spearman's rank correlation rho
data: a and b
S = 0, p-value = 5.511e-06
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
1
벡터 a및 b좋은을 가지고 있지만 지금까지 완벽한 선형 (피어슨)의 상관 관계에서. 그러나 그들은 완벽한 순위 상관 관계가 있습니다. Spearman의 를 참조하십시오. 이 경우 마지막 숫자 가 8.1, 9, 90 또는 9000 (시도하십시오!) 인지 여부는 중요하지 않습니다 . 8보다 큰 경우에만 중요합니다 . 그것이 순위를 연관시키는 차이가 만드는 것입니다. ρb
반면 반대로, a그리고 b완벽한 순위 상관 관계를 가지고, 자신의 피어슨 상관 계수는 피어슨 상관 관계가 순위에 반영되지 않도록보다 작은 1.이 쇼이다.
피어슨 상관 관계는 선형 함수, 즉 계급 상관 관계는 단순히 단조 함수를 반영합니다. 정상적인 데이터의 경우 두 데이터가 서로 매우 유사하므로 Spearman과 Pearson간에 데이터가 큰 차이를 나타내지 않는 것 같습니다.
실제 예를 들어, 다음을 고려하십시오. 키가 큰 사람이 체중이 더 나가는 지 확인하고 싶습니다. 그렇습니다. 어리석은 질문이지만 ... 이것이 당신이 신경 쓰는 것이라고 가정하십시오. 이제 키가 큰 사람도 작은 사람보다 넓기 때문에 질량은 무게에 비례하여 비례하지 않습니다. 따라서 무게는 키 의 선형 함수 가 아닙니다 . 당신보다 10 % 더 큰 사람은 (평균적으로) 10 % 더 무겁습니다. 이것이 신체 / 질량 지수가 분모의 큐브를 사용하는 이유입니다.
결과적으로 키 / 무게 관계를 부정확하게 반영하기 위해 선형 상관 관계를 가정합니다. 대조적으로, 순위 상관은이 경우 물리 및 생물학의 성가신 법칙에 둔감하다. 사람들이 키가 커짐에 따라 선형 적으로 더 무거워지면 반영하지 않으며, 키가 큰 사람들 (한 스케일에서 더 높은 순위)이 더 무겁다면 (다른 스케일에서 더 높은 순위) 단순히 반영합니다.
보다 일반적인 예는 사람들이 "완벽 / 좋은 / 좋은 / 중상 / 중병 / 나쁜 / 거짓"으로 평가하는 것과 같이 리 커트와 같은 설문지 순위의 예일 수 있습니다. "완벽한"은 "정확한"과는 거리가 "정확한"은 "나쁜" 과 는 거리가 멀지 만 둘 사이의 거리는 동일하다고 말할 수 있습니까? 선형 상관 관계가 반드시 적절한 것은 아닙니다. 순위 상관 관계가 더 자연 스러워요.
귀하의 질문을보다 직접적으로 해결하기 위해 : no, Pearson과 Spearman 상관의 p 값은 다르게 계산되어서는 안됩니다 . 개념적으로는 물론 숫자 적으로도 많이 다르지만 검정 통계량이 같으면 p 값이 같습니다.
Pearson 상관 관계의 정규성 가정에 대한 질문은 이 내용을 참조 하십시오 .
더 일반적으로, 다른 사람들은 파라 메트릭과 비모수 적 상관 관계 ( 여기 참조 ) 의 주제 와 분포 가정에 관한 의미에 관해 내가 할 수있는 것보다 훨씬 더 정교하게 설명했습니다 .