평균 상관 계수의 의의


11

면책 조항 :이 질문이 다른 질문과 너무 유사하다고 생각되면 병합하여 기쁩니다. 그러나, 나는 다른 곳에서 만족스러운 답변을 찾지 못했으며 (아직 의견을 제시하거나 찬성하는 "평판"을 얻지 못 했으므로) 새로운 질문을 직접하는 것이 최선이라고 생각했습니다.

내 질문은 이것입니다. 12 명의 인간 피험자 각각에 대해, 나는 독립 변수 X의 6 개 수준과 종속 변수 Y의 해당 관측치 사이의 상관 계수 (Spearman 's rho)를 계산했습니다. 귀무 가설은 일반 모집단에서이 상관 관계가 0이라는 것입니다. 이 가설을 두 가지 방법으로 테스트했습니다.

  1. 12 명의 피험자로부터 얻은 상관 계수에 대해 1 표본 t- 검정을 사용했습니다.

  2. 각 참가자에 대해 내 X 레벨과 Y 관찰을 중심으로하여 평균 (X) = 0 및 평균 (Y) = 0으로 설정 한 다음 집계 데이터 (X의 72 레벨 및 Y의 72 관찰)에 대한 상관 관계를 계산합니다. .

이제 상관 계수 (여기서 나 다른 곳)로 작업하는 것에 대해 읽음으로써 첫 번째 접근법이 유효한지 의심하기 시작했습니다. 특히, 나는 다음과 같은 방정식이 여러 장소에서 팝업되어 평균 코 릴레이션 계수에 대한 t- 검정으로 제시되었습니다.

t=rSEr=n21r2

여기서 은 평균 상관 계수이고 (피사체 별 계수에 대한 Fisher의 변환을 사용하여 이것을 얻은 것으로 가정) 은 관측치 수입니다. 직관적으로, 이것은 개체 간 변동성의 측정을 포함하지 않기 때문에 나에게 잘못 된 것 같습니다. 다시 말해, 상관 계수가 3 개이면 [0.1, 0.5, 0.9] 또는 [0.45 0.5 0.55]이든 동일한 평균 (및 ) 이든 상관없이 동일한 t- 통계량을 얻게됩니다.n n = 3rnn=3

따라서 위의 방정식은 실제로 평균 상관 계수의 유의성을 검정 할 때가 아니라 2 개의 변수 에 대한 관측 값을 기반으로 단일 상관 ​​계수의 유의성을 검정 할 때 적용된다고 생각 합니다.n

여기 누구든지이 직관을 확인하거나 왜 틀린지 설명해 주시겠습니까? 또한이 수식이 내 경우에 적용되지 않으면 누구나 / 올바른 접근 방법을 알고 있습니까? 아니면 내 자신의 테스트 번호 2가 이미 유효합니까? 모든 도움을 주시면 감사하겠습니다.


2
피어슨의 은 중심 및 스케일링 변환에 둔감하므로 중심은 귀하의 질문과 관련이 없다고 생각합니다. 예를 들어, cor ( ) = cor ( ) = cor ( ) = cor ( )입니다. X , Y X , Y ˉ Y X , Y + 1000 X , Y × 1000rX,YX,YY¯X,Y+1000X,Y×1000
Alexis

동의합니다. 그렇기 때문에 중심을 "각 변수를 모으기 전에 개별적으로 중심을 맞추는"것으로 해석했습니다.
Federico Tedeschi

1
@FedericoTedeschi 의미가 무엇입니까? YY¯
Alexis

@Alexis 나는 내 대답의 맨 아래에 당신에게 대답했다.
Federico Tedeschi

답변:


2

이 데이터를 분석하는 더 좋은 방법 은 랜덤 효과 (랜덤 인터셉트 또는 랜덤 인터셉트 + 기울기)로 혼합 (일명 혼합 효과 모델, 계층 적 모델)을 subject사용하는 것입니다. 내 다른 답변 을 요약하면 다음 같습니다.

이것은 본질적으로 단일의 전체 관계를 모델링하면서 그 관계가 그룹 (인간 주제)마다 다를 수 있도록하는 회귀입니다. 이 방법은 부분 풀링의 이점을 활용하고 데이터를보다 효율적으로 사용합니다.


-1

나는 변수 ( 와 )가 모든 개인에 대해 동일 하다고 가정합니다 (실제로 나는 레벨이 과목마다 같지 않다고 말함으로써 당신이 무엇을 의미하는지 잘 모르겠습니다. 각 변수에 대해 어떤 변수가 측정되는지가 아니라 변수 범위 간의 독립성에 대해 언급). 예, 표시 한 공식은 두 변수 간의 상관 계수에 적용됩니다.6 X 6 Y126 X6 Y

요점 2에서 정규화에 대해 이야기합니다. 변수 각각에 대해 개별적으로 수행하면 이것이 의미가 있다고 생각합니다 . 그러나 그럼에도 불구하고이 접근 방식의 문제점은 개체 간 종속성을 제어하지 않는다는 것입니다.62

나는 당신의 접근 방법 1도 유효하지 않다고 생각합니다. 왜냐하면 그것은 자유도가 분포 갖는 변수 중 테스트이기 때문에이 경우 중앙 제한 정리를 적용 할 수 없다고 생각합니다.106t10

어쩌면, 더 큰 숫자와 함께, 당신은 임의의 기울기를 허용하고 동시에 널 (평균 계수 모두 테스트, 임의의 효과 방법을 사용할 수 의 ) 및 임의 계수의 비 존재. 그러나 6 개의 변수와 12 개의 관측으로는 충분하지 않다고 생각합니다.Y XiYi

나는 사이의 상관 행렬의 (당신은 또한 대각선 아래의 값을 고려한다면 12이되는)은 6 개 값에 대한 시험으로 볼 제안 변수 (둘 다 와 ), 즉 제 2의 대각선에 그 (와 3 사분면과 동일합니다. 따라서 제한 모델과 제한 모델 사이의 우도 비율 검정을 작성합니다.X Y12XY

@Alexis 내 이해는 , 을 은 의미가 있습니다 ( 로 나누는 것도 의미가 있다고 생각합니다 ). 이런 식으로 변수 및 ( 을 고유 변수의 발생으로 간주하고 와 동일하게 고려하여 생성 )는 모두 평균 은 입니다. 반대로 두 개의 변수 먼저 빌드 하면 (X1,,X6Y1,,Y6X1=X1X1¯,,X6=X6X6¯,Y1=Y1Y1¯,,Y6=Y6Y6¯SEXYXi,1i6Yi0X,YXi,1i6마치 고유 변수가 발생하고 와 동일 한 것처럼 평균을 빼는 것 (및 와 의 SE로 나눔 )은 변경되지 않습니다.YiXY

01/01/18 수정

하자 변수 및 표시 ( )을 개별. 그런 다음에ij1j12

X1j=Y1j=10,j ;

X2j=Y2j=8,j ;

X3j=Y3j=6,j ;

X4j=Y4j=4,j ;

X5j=Y5j=2,j ;

X6j=Y6j=j,j .

이 경우의 상관 관계는 이어야합니다 .0.5428

대해 각 변수를 중앙에 배치하면 와 모두에 변동이 없으므로 입니다. 관해서 우리 값 얻을 용 IE ( 'S : 및 의 반대 ). 이후 및 , 우리가 얻을 : , 의 상관 관계를 암시합니다 .1i5XiYiXij=Yij=0i=6X6j=j6.5,Yj6=(13j)6.5=6.5jX5.5,4.5,3.5,2.5,1.5,0.5,0.5,1.5,2.5,3.5,4.5,5.5Y0=0j6.5=(6.5j)Xij=Yiji,jX=Y1


두 번째 절차를 따르면 동의합니다. 그렇기 때문에 루벤 반 베르겐 (Ruben van Bergen)은 내가 첫 번째 절차에서 설명한 것을 의미한다고 생각합니다. 이 경우, 우리는 다음을 가지고 있습니다 : 이지만 는 아닙니다 일반적으로 사실입니다. 반례를 보여주기 위해 게시물을 수정하고 있습니다. cor(Xi,Yi)=cor(Xi,Yi),icor(X,Y)=cor(X,Y)
Federico Tedeschi

의 상관을 제공하는 값 은 다음과 같습니다. ; . 상관 관계가 실제로 과 다르기 때문에 상관 관계가 실제로 인지 여부는 중요하지 않습니다 . 0.5428X=10,10,10,10,10,10,10,10,10,10,10,10,8,8,8,8,8,8,8,8,8,8,8,8,6,6,6,6,6,6,6,6,6,6,6,6,4,4,4,4,4,4,4,4,4,4,4,4,2,2,2,2,2,2,2,2,2,2,2,2,1,2,3,4,5,6,7,8,9,10,11,12Y=10,10,10,10,10,10,10,10,10,10,10,8,8,8,8,8,8,8,8,8,8,8,8,6,6,6,6,6,6,6,6,6,6,6,6,4,4,4,4,4,4,4,4,4,4,4,4,2,2,2,2,2,2,2,2,2,2,2,2,12,11,10,9,8,7,6,5,4,3,2,10.54281
Federico Tedeschi

의 상관 관계 및 는 입니다. 사실은 당신이 그 말 및 로 리드 사실이지만,이 만 즉, , 즉 이미 작성한 무언가이다. X=0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,5.5,4.5,3.5,2.5,1.5,0.5,0.5,1.5,2.5,3.5,4.5,5.5X=0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,5.5,4.5,3.5,2.5,1.5,0.5,0.5,1.5,2.5,3.5,4.5,5.51X=1,,12Y=12,,1cor(X,Y)=cor(X,Y)=1cor(Xi,Yi)=cor(Xi,Yi)
Federico Tedeschi

물론 : 이것은 선형 변환에 대한 상관의 불변의 결과입니다. 이것은 내가 처음으로 코멘트에 이미 동의 한 일이다, "나는 당신과 동의 나는대로를 중심으로 해석 이유입니다."그들을 함께두기 전에 개별적으로 각 변수를 중심으로 "."- 페데리코 Tedeschi 12월 27일 '17을 10시 27분에서cor(X;Y)=cor(XX¯;YY¯)
페데리코을 Tedeschi

아마도 "각 변수를 서로 맞추기 전에 개별적으로 중심에 두는 것"이 ​​무엇을 의미하는지 이해할 수 없습니다. 나에게 는 는 "각각 중앙에 있음"을 의미합니다 변수를 조합하기 전에 개별적으로 가변 " 우리의 명백한 다른 이해를 이해하도록 도와 줄 수 있습니까? X 1 - ˉ X , X 2 - ˉ X , , X n - ˉ XXX¯X1X¯,X2X¯,,XnX¯
Alexis
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.