r을 Fisher z로 변환하면 메타 분석에 도움이됩니까?


11

일반적으로 은 Fisher 로 변환되어 두 r 값 간의 차이를 테스트 합니다. 그러나 메타 분석을 수행 할 때 왜 그러한 단계를 수행해야합니까? 측정 오차 또는 비 샘플링 오차를 수정합니까? r 이 모집단 상관의 불완전한 추정 이라고 가정해야하는 이유는 무엇입니까?rzrr


1
귀하의 질문의 마지막 부분 ( "r이 인구 상관 관계의 불완전한 추정치라고 가정해야하는 이유")은 이전 부분과 다소 관련이 없습니다. 그리고 "불완전하다"는 무슨 뜻입니까? 편견을 의미합니까?
볼프강

@subhash : "측정 오류 또는 비 샘플링 오류 수정"의 의미를보다 정확하게 설명 할 수 있습니까? 임의의 변수, 분포, 모수 또는 추정값과 같은 용어로 표현하는 것과 같이 이러한 용어를 모호하지 않게 정의 할 수 있으면 질문에 대한 답변이 더 쉬울 수 있습니다.
Adam Hafdahl

답변:


24

실제 상관 계수 또는 r에서 z로 변환 된 값으로 메타 분석을 수행해야하는지에 대해서는 실제로 문헌에 상당히 많은 논쟁이 있습니다. 그러나이 논의를 제외하고는 변환이 적용되는 두 가지 이유가 있습니다.

  1. 많은 메타 분석 방법은 관찰 된 결과의 샘플링 분포가 (적어도 대략) 정상이라고 가정합니다. 때 특정 연구 (진정한 상관 관계가) 멀리 0이며, 표본 크기가 작고, 다음 (원시)의 상관 관계의 샘플링 분포는 매우 왜곡되고 잘 정규 분포로 근사 전혀 없습니다. Fisher의 r-z 변환은 다소 효과적인 정규화 변환이됩니다 (이 변환의 기본 목적은 아니지만 아래 참조).ρ

  2. 많은 메타 분석 방법은 관찰 된 결과의 샘플링 분산이 (적어도 대략적으로) 알려져 있다고 가정합니다. 예를 들어, 원시 상관 계수의 경우 샘플링 분산은 대략 다음과 같습니다.

Var[r]=(1ρ2)2n1

실제로 계산 하려면 해당 방정식에서 알 수없는 값에 대해 무언가를 수행해야합니다 . 예를 들어 관측 된 상관 관계 (즉, )를 방정식에 꽂을 수 있습니다 . 이것은 우리에게 샘플링 분산의 추정치를 제공 할 것이지만, 이것은 다소 부정확 한 추정치입니다 (특히 작은 샘플에서). 반면에, r에서 z로 변환 된 상관의 샘플링 분산은 대략 다음과 같습니다.Var[r]ρr

Var[z]=1n3

이것은 더 이상 알려지지 않은 수량에 의존하지 않습니다. 이것은 실제로 r-to-z 변환 (변형의 실제 목적)의 분산 안정화 특성입니다.


4
+1, 이것은 정말 유익한 정보입니다. 한 번 이상 공표 할 수 있기를 바랍니다.
gung-복직 모니카

@Wolfgang 꽤 흥미 롭습니다. 메타 분석 컨텍스트를 취하면 더 나을 수 있습니다. r은 바이어스되지 않은 추정치입니다 (Hedges and Olkin, 1985). 표본 상관의 메타 분석을 위해 Fisher의 z로 변환해야합니까? 이 각도에서 설명하십시오.
Subhash C. Davar

1
네, 바이어스는 일반적으로 무시할 것을 알고있다 (그리고 실제로는 보정되지 않습니다)하지만 그 말을 정확하지 편견이다. 또한 수식이 샘플링 오류를 수정 하지 않습니다 . 이들은 단순히 표본 분산을 계산하는 데 사용되며 변환 된 원시 상관의 가중 평균을 계산하는 데 사용됩니다. 측정 오류는 또 다른 문제입니다. 감쇠 보정을 사용하여 측정 오차에 대한 상관도 보정 할 수 있습니다. r
Wolfgang

1
@subhash : "r이 편향되지 않았습니다 (측정 오류)"라는 의미를 명확하게 설명 할 수 있습니까? F. Schmidt, J. Hunter 및 몇몇 동료 및 기타 저자가 유효성 일반화를위한 메타 분석 기술에서 사용한 고전적 테스트 이론의 개념을 언급하고 있습니까? 아시다시피, 이들의 방법은 "유물"에 대해 "수정 된" "실제"상관 관계의 연구 간 평균 및 분산 추정을 강조합니다 (예 : 신뢰성, 범위 제한, 이분법 화).
Adam Hafdahl

1
만약 우리가 가 무작위로 변하는 메타 분석의 무작위 효과 관점을 (예를 들어, 연구들 사이에서), 우리는 또는 그것의 Fisher-z 대응 물 effect-size 매개 변수에 대한 메타 분석 가정을 더 잘 충족시킵니다. 예를 들어, 또는 가 정규 분포 일 가능성이 더 큰지 , 일부 절차 (예 : 특정 최대 가능성 추정기 및 "신뢰도"또는 예측 간격)가 확실하지 않은 경우가 종종 있습니다. ρρζ=tanh1ρρζ
Adam Hafdahl
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.