Fisher의 변환을 사용하여 3 개 이상의 상관 관계에 대한 유의성 검정


9

이전 게시물에서 내가 이해할 수있는 한, 세 개의 상관 계수가있는 경우 두 쌍의 상관 계수가 유의미한 지 확인하기 위해 쌍으로 테스트해야합니다.

이것은 Fishers 변환을 사용하여 r의 z 점수와 z의 p 값 (이전 게시물의 권장 계산기가 고맙게도)을 계산 한 다음 p 값 이보다 높거나 낮은 지 확인해야 함을 의미합니다. 각 쌍의 내 알파 값 (0.05).

즉, 21 ~ 30 세가 연령 그룹 1이고, 31 ~ 40 세가 연령 그룹 2이고, 41 ~ 50 세가 연령 그룹 2 인 경우, 쇼핑 습관과 체중 감량 간의 상관 관계를 비교하면 다음과 같습니다.

  • 그룹 1 대 그룹 2
  • 그룹 1과 그룹 3
  • 그룹 2 대 그룹 3

세 가지 별도의 계산을 수행하는 대신 이러한 모든 계산을 한 번에 수행 할 수있는 방법이 있습니까?


1
좀 더 자세하게 설명해 주시겠습니까? 에서와 같이-귀하의 응답, 설명 변수 및 어떤 상관 관계가 있습니까? 상관 관계 테스트를위한 Fisher의 변환이 아닐 수 있습니다. 간단한 t- 검정으로 충분할 수 있습니다.
suncoolsu

@suncoolsu이 세 그룹의 쇼핑 습관과 체중 증가 사이의 상관 관계를 테스트하고 있습니다. 나의 결과는 다음과 같다 : 그룹 1 : r = .8978, n = 105; 그룹 2 : r = .5678, n = 95; 및 그룹 3 : r = .7865, n = 120.
Adhesh Josh

귀하의 데이터가 IOTT를 통과한다고 생각합니다. 그것은 눈의 외상 검사입니다. 눈 사이에 닿습니다. .9, .6 및 .8의 상관 관계가 서로 다르지 않으면 무엇입니까? 그러나 당신이 정말로 관심이 있다면
Peter Flom

답변:


4

귀하의 질문은 양적질적 예측 변수 가 포함 된 회귀 모형의 완벽한 예입니다 . 특히 세 연령대는1,2,&3 -질적 변수이고, 양적 변수는 쇼핑 습관체중 감량입니다 (상관 관계를 계산하기 때문에 추측하고 있습니다).

모델링 할 데이터가 많기 때문에 오차 추정치 (p- 값 등)가 더 안정적이기 때문에이 방법이 별도의 그룹 별 상관 관계를 계산하는 것보다 훨씬 나은 모델링 방법이라는 점을 강조해야합니다. 더 기술적 인 이유는 회귀 계수의 중요성을 테스트하기 위해 t- 검정 통계량에서 결과 자유도가 높아지기 때문입니다.

규칙에 따라 운영 c 질적 예측 변수는 c1 지표 변수, 두 지표 변수 만 X1,X2여기에 다음과 같이 정의되어 있어야합니다.

X1=1 if person belongs to group 1;0 otherwise.
X2=1 if person belongs to group 2;0 otherwise.

이것은 그 그룹을 의미합니다 3 로 표현된다 X1=0,X2=0; 귀하의 응답을 나타내는 쇼핑 습관Y 정량 설명 변수 체중 감량 W. 이제이 선형 모형에 적합합니다

E[Y]=β0+β1X1+β2X2+β3W.
명백한 질문은 우리가 변화하더라도 중요합니까 WY(쇼핑 변수를 응답 변수로 무작위로 선택했기 때문에). 대답은 그렇습니다. 회귀 계수의 추정치는 변경되지만 조건부 그룹 사이의 "연관성"에 대한 검정 (여기서는 t- 검정이지만 단일 예측 변수에 대한 상관 검정과 동일)은 그렇지 않습니다 변화. 명백히

E[Y]=β0+β3W -- for third group,
E[Y]=(β0+β2)+β3W -- for second group,
E[Y]=(β0+β1)+β3W -- for first group,
이것은 도표에 따라 그룹에 따라 3 개의 개별 선을 갖는 것과 같습니다. Y vs W. 이는 테스트 대상을 시각화하는 좋은 방법입니다 (기본적으로 EDA 및 모델 검사의 형태이지만 그룹화 된 관측 값을 올바르게 구분해야 함). 세 개의 평행선은 세 그룹간에 상호 작용이 없음을 나타냅니다.W상호 작용이 많으면 이러한 선이 서로 교차 할 것입니다.

테스트는 어떻게합니까? 기본적으로 일단 모델에 적합하고 추정치를 얻으면 몇 가지 대비를 테스트해야합니다. 특히 당신의 비교를 위해 :

Group 2 vs Group 3: β2+β0β0=0,
Group 1 vs Group 3: β1+β0β0=0,
Group 2 vs Group 1: β2+β0(β0+β1)=0.

기울기의 동등성 검정은 상관 관계의 동등성 검정과 다릅니다. 예를 들면 다음과 같습니다. jessicagrahn.com/uploads/6/0/8/5/6085172/comparecorrcoeff.doc
Wolfgang

동의하지만 단일 예측 변수의 경우이 관계 때문에 동일해야합니다 t=ρn21ρ2tn2.
suncoolsu

또한 문서는 다른 모집단 비교에 대해 이야기하지만 단일 예측 변수의 경우는 아닙니다.
suncoolsu

요점은 H0:β1=β2=β3 사실 일 수 있지만 H0:ρ1=ρ2=ρ3거짓 일 수도 있고 그 반대 일 수도 있습니다. X와 Y의 상관 관계는βX의 분산 및 오차의 분산도 포함됩니다. X의 편차 및 / 또는 오류가 3 개의 그룹에서 다른 경우 다른 가설을 검정하는 것입니다.
Wolfgang

예, 그렇습니다 (앞서 언급했듯이). 그러나 내 의견에 따르면 OP는 그룹을 기준으로 wt.loss와 쇼핑 습관 사이의 관계를 결정하는 데 관심이 있다고 가정합니다 (상관 관계는 아님). OP가 다른 답변을 수락했기 때문에 내가 틀렸다고 생각합니다. 그럼에도 불구 하고이 답변은 유용한 대안으로 사용됩니다.
suncoolsu

1

이 상황에서의 페어 와이즈 테스트는 아직 데이터 설명으로 정당화되지 않습니다. 다중 변수 회귀 분석법을 사용해야합니다. R 통화는 다음과 같습니다.

lm( weight_end ~ shop_habit + age_grp + weight_begin)

분류가 연속적인 관계를 왜곡 할 수 있고 스플라인 항이 임의의 분리 점을 선택할 필요가 없기 때문에 3 개의 범주를 구성하는 것이 연령을 제어하는 ​​가장 좋은 방법은 아닙니다 (또는 주요 질문 인 경우 기여도 분석). 적절한 분석 후 체중 변화와 관련된 증거가 충분하면 배포 할 수있는 임시 테스트 옵션이 있습니다.

(나는 @ whuber가 의견에 표현한 대부분의 내용에 동의했으며 일반적으로 그의 논평은 권위가 있지만 회귀 접근법에 대한 그의 입장은 이해하지 못합니다.)

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.