배경 : 저자가 표본 크기 878에서 Pearson 상관 관계 0.754를보고하는 기사를 읽었습니다 . 상관 관계 테스트의 결과 p- 값은 "두 별"로 유의합니다 (예 : p <0.01). 그러나 표본 크기가 크면 해당 p- 값이 0.001보다 작아야합니다 (즉, 별 3 개 중요).
- 이 테스트에 대한 p- 값을 Pearson 상관 계수 및 샘플 크기만으로 계산할 수 있습니까?
- 그렇다면 R에서 어떻게 할 수 있습니까?
배경 : 저자가 표본 크기 878에서 Pearson 상관 관계 0.754를보고하는 기사를 읽었습니다 . 상관 관계 테스트의 결과 p- 값은 "두 별"로 유의합니다 (예 : p <0.01). 그러나 표본 크기가 크면 해당 p- 값이 0.001보다 작아야합니다 (즉, 별 3 개 중요).
답변:
Fisher의 R에서 Z로 변환을 사용하면 가능합니다. 다른 방법 (예 : 부트 스트랩)에는 몇 가지 장점이 있지만 원래 데이터가 필요합니다. R에서 ( r 은 표본 상관 계수, n 은 관측치 수) :
z <- 0.5 * log((1+r)/(1-r))
zse <- 1/sqrt(n-3)
min(pnorm(z, sd=zse), pnorm(z, lower.tail=F, sd=zse))*2
내 블로그에서이 게시물을 참조하십시오 .
.01이든 .001이든 그다지 중요하지 않습니다. 당신이 말했듯이, 이것은 대부분 샘플 크기의 함수이며 샘플 크기가 크다는 것을 이미 알고 있습니다. 논리적 결론은 아마도 검정이 전혀 필요하지 않다는 것입니다 (특히 상관이 0이라는 소위 'nil'가설에 대한 검정은 아닙니다). 함께 N = 878, 당신이 직접 해석에 대한 평가 및 초점의 정확성에 매우 확신 할 수 있습니다 (즉 자신의 분야에서 0.75 큰?).
그러나 공식적으로 Neyman-Pearson 프레임 워크에서 통계 테스트를 수행 할 때는 오류 수준을 미리 지정해야합니다. 따라서 테스트 결과가 실제로 중요하고 연구가 임계 값으로 .01로 계획된 경우 p <.01 을보고하는 것이 합리적 이며 획득 한 p 값을 기준으로 p <.001을 기회로 만들면 안됩니다 . 이러한 유형의 공개되지 않은 유연성은 작은 별들에 대한 비판의 주된 이유 중 하나이며,보다 일반적으로 귀무 가설 유의성 테스트가 사회 과학에서 수행되는 방식입니다.
또한 Meehl, PE (1978)를 참조하십시오. 이론적 위험과 표 별표 : 칼, 로널드 경, 부드러운 심리학의 느린 진행. 컨설팅 및 임상 심리학 저널, 46 (4), 806-834. 제목에는 이러한 "별"에 대한 참조가 포함되어 있지만 내용은 유의성 테스트의 역할에 대한 훨씬 광범위한 토론입니다.
Fisher의 R에서 Z로 변환을 사용합니다.
다른 통계가 있습니다.
abs(r)*sqrt((n-2)/(1-r^2)) ~ t.dist(d.f.=n-2)
그것은 n-2 자유 도로 t- 분포가 있습니다. 예를 들면 다음과 같습니다. http://www.danielsoper.com/statcalc3/calc.aspx?id=44