Fisher의 z- 변형은 언제 적절한가요?


13

p- 값을 사용하여 유의성에 대해 표본 상관 관계 을 테스트하려고합니다.r

H0:ρ=0,H1:ρ0.

Fisher의 z- 변환을 사용하여 이것을 계산할 수 있음을 이해했습니다.

zobs=n32ln(1+r1r)

에 의해 p- 값을 찾는

p=2P(Z>zobs)

표준 정규 분포를 사용합니다.

내 질문은 : 이것이 적절한 변환이 되려면 얼마나 큰 이어야합니까? 분명히 n 은 3보다 커야합니다. 제 교과서에는 어떤 제한도 언급되어 있지 않지만 이 프레젠테이션 의 슬라이드 29에서 n 은 10보다 커야 한다고 말합니다 . 고려할 데이터의 경우 5 n 10 .nnn5n10


2
위키 페이지 목록의 표준 오차 주어진다 1 / zobs 여기서N은 샘플 크기입니다. 따라서 최소한 4 개의 완전한 쌍이 필요합니다. 샘플 크기에 대한 제한을 넘어서는 제한이 없습니다. 1/N3N
COOLSerdash

8
자신의 대학 이름을 철자 할 수없는 사람의 프레젠테이션을 얼마나 신뢰할 수 있는지 잘 모르겠습니다. 더 진지하게, 모든 표본이 특정 표본 크기보다 우수하고 그렇지 않다는 것을 암시하는 모든 조언에주의하십시오. 표본 크기와 데이터 분포에 따라 근사화 품질이 순조롭게 증가합니다. 간단한 조언은 매우 신중하고, 모든 것을 계획하고, 부트 스트랩 된 신뢰 구간으로 교차 점검하는 것입니다.
Nick Cox

1
슬라이드 17은 특별한 경우 대한 t- 검정을 설명합니다 . ρ=0
whuber

답변:


8

이와 같은 질문에 대해서는 시뮬레이션을 실행하고 예상대로 작동하는지 확인합니다. P는 - 값은 무작위로 널 가설에 해당하면 벗어날 데이터로 널 가설에서만큼 적어도 당신이 관찰하는 샘플을 그리기의 확률이다. 따라서 이러한 샘플 이 많고 그 중 하나의 p- 값이 .04 인 경우 해당 샘플의 4 %가 .04보다 작은 값을 가질 것으로 예상합니다. 다른 가능한 모든 p- 값에 대해서도 마찬가지입니다 .pppp

아래는 Stata의 시뮬레이션입니다. 그래프가 있는지 여부를 확인 -values 그들이 측정하는데 무엇을 측정, 즉, 그들은 방법을 보여줍니다 많이와 샘플의 비율 P는 -values 이하 공칭 이상의 페이지 공칭에서 - 값 벗어날 P는 - 값. 보시다시피, 적은 수의 관측으로 테스트가 다소 문제가 있음을 알 수 있습니다. 귀하의 연구에 너무 문제가 있는지 여부는 판단 요청입니다.pppp

clear all
set more off

program define sim, rclass
    tempname z se
    foreach i of numlist 5/10 20(10)50 {
        drop _all
        set obs `i'
        gen x = rnormal()
        gen y = rnormal()
        corr x y 
        scalar `z'  = atanh(r(rho))
        scalar `se' = 1/sqrt(r(N)-3)
        return scalar p`i' = 2*normal(-abs(`z'/`se'))
    }
end

simulate p5 =r(p5)  p6 =r(p6)  p7  =r(p7)     ///
         p8 =r(p8)  p9 =r(p9)  p10 =r(p10)    ///
         p20=r(p20) p30=r(p30) p40 =r(p40)    ///
         p50=r(p50), reps(200000) nodots: sim 

simpplot p5 p6 p7 p8 p9 p10, name(small, replace) ///
    scheme(s2color) ylabel(,angle(horizontal)) 

여기에 이미지 설명을 입력하십시오

simpplot p20 p30 p40 p50 , name(less_small, replace) ///
    scheme(s2color) ylabel(,angle(horizontal)) 

여기에 이미지 설명을 입력하십시오


1
n


1

zH0:ρ=0ρrzt

H0:ρ=ρ00ρ0nnα

Nick의 요점은 공정한 것입니다. 근사와 권장 사항은 항상 일부 회색 영역에서 작동합니다.

n(tα/2s/ϵ)2tsn(1.96s/ϵ)2


4
zzz

1
zH0:ρ=ρ00t

3
ztρ=0

1
z

ϵn
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.