몇 가지 예를 실행했을 때 rho 및 피어슨 순위의 t- 검정에 대한 p- 값은 항상 일치합니다. 마지막 몇 자리를 저장하십시오.
그럼 당신은 잘못된 예제를 실행했습니다!
a = c(1,2,3,4,5,6,7,8,9)
b = c(1,2,3,4,5,6,7,8,90)
cor.test(a,b,method='pearson')
Pearson's product-moment correlation
data: a and b
t = 2.0528, df = 7, p-value = 0.0792
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.08621009 0.90762506
sample estimates:
cor
0.6130088
cor.test(a,b,method='spearman')
Spearman's rank correlation rho
data: a and b
S = 0, p-value = 5.511e-06
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
1
벡터 a
및 b
좋은을 가지고 있지만 지금까지 완벽한 선형 (피어슨)의 상관 관계에서. 그러나 그들은 완벽한 순위 상관 관계가 있습니다. Spearman의 를 참조하십시오. 이 경우 마지막 숫자 가 8.1, 9, 90 또는 9000 (시도하십시오!) 인지 여부는 중요하지 않습니다 . 8보다 큰 경우에만 중요합니다 . 그것이 순위를 연관시키는 차이가 만드는 것입니다. ρb
반면 반대로, a
그리고 b
완벽한 순위 상관 관계를 가지고, 자신의 피어슨 상관 계수는 피어슨 상관 관계가 순위에 반영되지 않도록보다 작은 1.이 쇼이다.
피어슨 상관 관계는 선형 함수, 즉 계급 상관 관계는 단순히 단조 함수를 반영합니다. 정상적인 데이터의 경우 두 데이터가 서로 매우 유사하므로 Spearman과 Pearson간에 데이터가 큰 차이를 나타내지 않는 것 같습니다.
실제 예를 들어, 다음을 고려하십시오. 키가 큰 사람이 체중이 더 나가는 지 확인하고 싶습니다. 그렇습니다. 어리석은 질문이지만 ... 이것이 당신이 신경 쓰는 것이라고 가정하십시오. 이제 키가 큰 사람도 작은 사람보다 넓기 때문에 질량은 무게에 비례하여 비례하지 않습니다. 따라서 무게는 키 의 선형 함수 가 아닙니다 . 당신보다 10 % 더 큰 사람은 (평균적으로) 10 % 더 무겁습니다. 이것이 신체 / 질량 지수가 분모의 큐브를 사용하는 이유입니다.
결과적으로 키 / 무게 관계를 부정확하게 반영하기 위해 선형 상관 관계를 가정합니다. 대조적으로, 순위 상관은이 경우 물리 및 생물학의 성가신 법칙에 둔감하다. 사람들이 키가 커짐에 따라 선형 적으로 더 무거워지면 반영하지 않으며, 키가 큰 사람들 (한 스케일에서 더 높은 순위)이 더 무겁다면 (다른 스케일에서 더 높은 순위) 단순히 반영합니다.
보다 일반적인 예는 사람들이 "완벽 / 좋은 / 좋은 / 중상 / 중병 / 나쁜 / 거짓"으로 평가하는 것과 같이 리 커트와 같은 설문지 순위의 예일 수 있습니다. "완벽한"은 "정확한"과는 거리가 "정확한"은 "나쁜" 과 는 거리가 멀지 만 둘 사이의 거리는 동일하다고 말할 수 있습니까? 선형 상관 관계가 반드시 적절한 것은 아닙니다. 순위 상관 관계가 더 자연 스러워요.
귀하의 질문을보다 직접적으로 해결하기 위해 : no, Pearson과 Spearman 상관의 p 값은 다르게 계산되어서는 안됩니다 . 개념적으로는 물론 숫자 적으로도 많이 다르지만 검정 통계량이 같으면 p 값이 같습니다.
Pearson 상관 관계의 정규성 가정에 대한 질문은 이 내용을 참조 하십시오 .
더 일반적으로, 다른 사람들은 파라 메트릭과 비모수 적 상관 관계 ( 여기 참조 ) 의 주제 와 분포 가정에 관한 의미에 관해 내가 할 수있는 것보다 훨씬 더 정교하게 설명했습니다 .