Wilcoxon 부호있는 순위 통계적 유의성 검정에서 값이 일부 데이터를 . 의 임계 값으로 ,이 결과는 귀무 가설을 기각하기에 충분 합니까 , 또는 p- 값을 소수점 이하 3 자리로 반올림하면 이되기 때문에 검정이 결정적이지 않다고 말하는 것이 더 안전 합니까?0.04993 p < 0.05 0.050
Wilcoxon 부호있는 순위 통계적 유의성 검정에서 값이 일부 데이터를 . 의 임계 값으로 ,이 결과는 귀무 가설을 기각하기에 충분 합니까 , 또는 p- 값을 소수점 이하 3 자리로 반올림하면 이되기 때문에 검정이 결정적이지 않다고 말하는 것이 더 안전 합니까?0.04993 p < 0.05 0.050
답변:
여기에는 두 가지 문제가 있습니다.
1) 공식 가설 테스트를 수행하는 경우 (그리고 이미 내 책에서 p- 값을 인용하는 한) 공식 거부 규칙은 무엇입니까?
테스트 통계를 임계 값과 비교할 때 임계 값은 기각 영역에 있습니다. 이 형식은 모든 것이 연속적 일 때는 중요하지 않지만 테스트 통계의 분포가 불연속적인 경우에는 중요합니다.
이에 따라 p- 값과 유의 수준을 비교할 때 규칙은 다음과 같습니다.
p ≤ α 인 경우 거부
p- 값을 0.05로 올림하더라도 실제로 값이 정확히 0.05 인 경우에도 공식적으로 거부해야합니다 .
2) '우리의 p- 값은 우리에게 무엇을 말합니까?'라는 관점에서 p- 값을 '널에 대한 증거'로 해석 할 수 있다고 가정하면 (그에 대한 의견이 다소 나뉘어져 있다고 말하자) 0.0499와 0.0501은 그렇지 않습니다 실제로 데이터에 대해 다른 것을 말하십시오 (효과 크기는 거의 같은 경향이 있습니다).
나의 제안은 (1) null을 공식적으로 거부하고, 그것이 정확히 0.05 인 경우에도 여전히 거부되어야한다고 지적 할 것이다. (2) α = 0.05 에 대해 특별히 특별한 것은 없으며 경계선에 매우 가깝습니다. 심각 임계 값이 약간 작더라도 거부로 이어지지 않습니다.
중요한 문제는 "우리 는 몇 가지 데이터를 발견했습니다 ..." 라는 문구 입니다.
이러한 종류의 통계적 부정 행위의 이름은 data dredging 입니다. 나는 논문에서 흥미로운 가설로보고하는 것에 대해 애매 모호하다. 당신이 기대할만한 물리적 인 이유가 있습니까?
그러나 한 가지 방법이 있습니다. 아마 당신은 결정 선험적가 그냥이 수행 한 그냥이에 테스트를 하나 개의 데이터 세트. 당신은 나중에 그것을 증명할 수 있도록 다른 사람 앞에서 실험실 노트북에 그것을 썼습니다. 그런 다음 테스트를 수행했습니다.