회귀 기울기를 비교하여 그룹 간의 상관 관계를 비교할 수 있습니까?


10

에서 이 질문에 그들은 (예 : 여성 대 남성으로) 두 개의 독립적 인 그룹에 대한 피어슨 R을 비교하는 방법 부탁드립니다. 답장과 의견은 두 가지 방법을 제안했습니다.

  1. r의 "z- 변환"을 사용하여 Fisher의 잘 알려진 공식을 사용하십시오.
  2. 기울기 (회귀 계수) 비교를 사용하십시오.

후자는 포화 선형 모델 로 쉽게 수행 할 수 있습니다. 여기서 와 는 상관 변수이고 는 두 그룹을 나타내는 더미 (0 대 1) 변수입니다. 의 크기 (상호 작용 기간 계수)를 정확하게 계수의 차이 모델 후 각각 두 그룹에서 실시하고, 그 ( 'S) 의미 따라서 그룹 간의 기울기 차이의 테스트입니다.와이=+엑스++엑스엑스와이와이=+엑스

이제 경사 또는 회귀 코프입니다. 아직 상관 계수가 아닙니다. 그러나 우리는 표준화 경우 와 - 개별적으로 두 그룹으로 - 다음 차이와 동일합니다 그룹 0 그룹 1 마이너스 R에서 R 하기 때문에 그 중요성은 두 상관 관계의 차이를 테스트합니다 : 우린 테스트 슬로프를하지만, 상관 관계를 테스트하고있는 것처럼 보입니다.엑스와이

내가 올바르게 작성 했습니까?

그렇다면 상관 관계를 더 잘 테스트 할 수있는 질문이 남았습니다. 그들은 동일한 결과를 얻지 못할 것입니다. 어떻게 생각해?

나중에 편집 : @ Wolfgang 에게 답장을 보내 주셔서 감사합니다 . 그럼에도 불구하고 Fisher의 테스트가 위에서 설명한 슬로프 비교 표준화 접근법보다 r에 대한 테스트보다 더 정확한 이유를 이해 하지 못한다고 생각 합니다. 따라서 더 많은 답변을 환영합니다. 감사합니다.

답변:


10

당신이 쓴 모든 것이 정확합니다. 장난감 예제를 사용하면 항상 이와 같은 것을 테스트 할 수 있습니다. 다음은 R의 예입니다.

library(MASS)

rho <- .5  ### the true correlation in both groups

S1 <- matrix(c( 1,   rho,   rho, 1), nrow=2)
S2 <- matrix(c(16, 4*rho, 4*rho, 1), nrow=2)

cov2cor(S1)
cov2cor(S2)

xy1 <- mvrnorm(1000, mu=c(0,0), Sigma=S1)
xy2 <- mvrnorm(1000, mu=c(0,0), Sigma=S2)

x <- c(xy1[,1], xy2[,1])
y <- c(xy1[,2], xy2[,2])
group <- c(rep(0, 1000), rep(1, 1000))

summary(lm(y ~ x + group + x:group))

실제 상관 관계가 두 그룹에서 동일하더라도 상호 작용이 매우 중요하다는 것을 알 수 있습니다. 왜 그런 일이 발생합니까? 두 그룹의 원시 회귀 계수는 상관의 강도뿐만 아니라 두 그룹의 X (및 Y) 스케일링을 반영하기 때문입니다. 이러한 스케일링이 다르기 때문에 상호 작용이 중요합니다. 상관 관계의 차이를 테스트하려면 위 모델의 상호 작용을 테스트하기 만하면되기 때문에이 점은 중요한 점입니다. 계속하자 :

summary(lm(xy2[,2] ~ xy2[,1]))$coef[2] - summary(lm(xy1[,2] ~ xy1[,1]))$coef[2]

이것은 두 그룹에 개별적으로 적합 된 모형에 대한 회귀 계수의 차이가 교호 작용 항과 정확히 동일한 값을 제공한다는 것을 보여줍니다.

우리가 실제로 관심있는 것은 상관 관계의 차이입니다.

cor(xy1)[1,2]
cor(xy2)[1,2]
cor(xy2)[1,2] - cor(xy1)[1,2]

이 차이는 본질적으로 0입니다. 두 그룹 내에서 X와 Y를 표준화 하고 전체 모형을 다시 합시다 :

x <- c(scale(xy1[,1]), scale(xy2[,1]))
y <- c(scale(xy1[,2]), scale(xy2[,2]))
summary(lm(y ~ x + x:group - 1))

인터셉트 또는 그룹 주요 효과는 여기에 포함되어 있지 않습니다. x에 대한 계수는 그룹 1에 대한 상관과 같고 교호 작용에 대한 계수는 두 그룹에 대한 상관의 차이와 같습니다.

이제 Fisher의 r-to-z 변환을 사용하는 테스트를 사용하는 것보다이 방법을 사용하는 것이 더 나은지 여부에 대한 질문입니다.

편집하다

그룹 내에서 X 및 Y 값을 표준화 할 때 계산되는 회귀 계수의 표준 오차는이 표준화를 고려하지 않습니다. 따라서 올바르지 않습니다. 따라서 교호 작용에 대한 t- 검정은 제 1 종 오류율을 적절히 통제하지 않습니다. 이것을 조사하기 위해 시뮬레이션 연구를 수행했습니다. 언제ρ1=ρ2=0그러면 제 1 종 오류가 제어됩니다. 그러나 언제ρ1=ρ20t- 검정의 제 1 종 오류는 지나치게 보수적 인 경향이 있습니다 (즉, 주어진 횟수만큼 자주 거부하지 않음) α값). 반면 Fisher의 r-to-z 변환을 사용하는 테스트는 두 그룹의 실제 상관 관계 크기에 관계없이 적절하게 수행됩니다 (그룹 크기가 매우 작은 경우와 두 그룹의 실제 상관 관계는 제외). 가까이 다가 가다±1.

결론 : 상관의 차이를 테스트하려면 Fisher의 r-z 변환을 사용하여 해당 값의 차이를 테스트하십시오.


Fisher 변환이 다른 테스트보다 장점이 있습니까?
mark999

내가 너무 빠르다는 것이 밝혀졌습니다. 내 편집 내용을 참조하십시오. 희망적으로 귀하의 질문에 대답해야합니다.
Wolfgang

따라서 @Wolfgang에서는 표준 이하의 경사 비교 방법이 r의 유효한 비교라고 주장합니다. Fisher의 유명한 대안은 실제로 그 근사치입니다. 내가 잘 이해 했습니까?
ttnphns

내 편집 내용을 참조하십시오. 나는 초기 결론에 너무 빠르다.
Wolfgang

@Wolfgang, 나중에 Fisher가 더 낫다는 답글의 EDIT을 추가했습니다. "표준화 할 때의 표준 오류 ... ...이 표준화를 고려하지 않기 때문에"표준 이하의 경사 비교 방법은 부적절합니다. 표준화 된 경사 비교 방법이 Fisher의 테스트만큼 유효 해 지도록 표준화를 어떻게 고려해야하는지 설명하십시오.
ttnphns
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.