두 Pearson 상관 관계의 강도를 비교하는 방법은 무엇입니까?


10

검토 자로부터 표에 제시된 Pearson 상관 관계 (r- 값)를 서로 비교할 수 있는지 여부를 물었습니다. 따라서 하나가 다른 것보다 "더 강력"하다고 주장 할 수 있습니다 (실제 r- 값을 눈으로 보는 것 이외) .

당신은 이것에 대해 어떻게 갈 것입니까? 이 방법을 찾았습니다

http://vassarstats.net/rdiff.html

그러나 이것이 적용되는지 확실하지 않습니다.


2
두 관측치가 동일한 관측 표본에서 계산됩니까?
Dimitriy V. Masterov

차이에 대한 신뢰 구간과 같은 것이 효과가있을 수 있습니다. 일부 분포 가정 또는 점근 법 정규 근사에서 시뮬레이션을 사용할 수 있습니다. 큰 샘플에서는 부트 스트랩을 사용할 수 있습니다.
Glen_b-복지 모니카

rs 작업의 CI에 대해 z 점수에서 CI를 도출하고 z를 r로 다시 변환하는 AFAIK 부트 스트랩 CI의 경우에도 먼저 변환하는 것이 적절할 수 있습니다.
jona

답변:


22

( 샘플에서 얻은 r 에 대해 이야기한다고 가정합니다 .)

해당 웹 사이트의 테스트는 r 이 두 모집단간에 값이 다를 수있는 매개 변수와 같이 취급한다는 의미에서 적용됩니다 . 어떻게 r은 당신이 사용 비교에서 매우 확신하는 등의 수단으로, 다른 측정에서 어떤 다른 t -test를? 글쎄, 그것은 -1,1 사이에 묶여 있고, 적절한 분포를 가지고 있지 않다는 점에서 다릅니다. 따라서 추론하기 전에 Fisher를 변환 해야합니다 (예를 들어 CI를 얻으려면 나중에 다시 변환해야 함). 테스트 결과 z 점수는 추론하기에 적합한 형식을 갖습니다. 그것이 당신이 연결하고있는 테스트가하는 일입니다.

따라서 여러분이 연결하는 것은 표본을 추출하는 모집단 전체에 대해 r 을 구할 수있을 때 발생할 수있는 일 을 추론 하는 절차입니다. 한 그룹 의 r 이 다른 그룹보다 높을까요? 그들은 정확히 동일합니까? 이것을 나중에 가설 H라고합시다0. 검정에서 낮은 p 값을 반환하면 표본을 기반으로 두 r 간의 차이에 대한 실제 값 이 정확히 0 이라는 가설에 대한 확신이 거의 없음을 의미합니다 (이러한 데이터는 거의 발생하지 않으므로 r 의 차이 는 정확히 0이었다). 그렇지 않은 경우,이 가설 이 사실이고 샘플이 충분하지 않기 때문에 정확하게 같은 r의 가설을 자신있게 기각 할 데이터가 없습니다 . 평균의 차이 ( t- 검정 사용 ) 또는 다른 측정 값에 대해 동일한 이야기를 수행 할 수 있습니다 .

완전히 다른 질문은이 둘의 차이가 의미 가 있을지에 대한 것 입니다. 슬프게도 이에 대한 직접적인 대답은 없으며 통계 테스트를 통해 답을 얻을 수 없습니다. r 의 실제 값 (여러분이 관찰 한 값이 아닌 모집단 값)은 한 그룹에서는 .5이고 다른 그룹에서는 .47 일 수 있습니다. 이 경우 동등성에 대한 통계적 가설 (우리의 H0)는 거짓입니다. 그러나 이것이 의미있는 차이점입니까? 그것은 3 % 정도 더 설명 된 분산이 의미가 있거나 의미가없는 것입니까? 코헨은 r 을 해석 하기 위한 대략적인 지침 을 제시 했지만 아마도 r 의 차이점에 대한 지침 을 제시 했지만 이것들은 출발점에 지나지 않는다는 조언에 의해서만 그렇게했다. 또한 두 상관 관계의 차이에 대한 CI를 계산하여 추론을 수행하더라도 정확한 차이를 알지 못합니다. 가능한 범위의 차이가 데이터와 호환 될 가능성이 높습니다.

비교적 안전한 방법은 r에 대한 신뢰 구간 과 CI의 차이에 대한 신뢰 구간을 계산 하여 독자가 결정하도록하는 것입니다.


4
당신이 선생님인지 모르겠지만 그래야합니다. 훌륭한 설명 덕분에 통계에 대한 기본 지식이있는 사람도 쉽게 이해할 수 있습니다.
airstrike
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.