몇몇 테스트에서 R
, 온 하한치가 P 값 의 계산 . 그 이유가 무엇인지, 또는 임의의 이유인지 확실하지 않습니다. 다른 많은 통계 패키지는로 이동 0.0001
하므로 훨씬 높은 수준의 정밀도입니다. 그러나 또는 보고하는 논문이 너무 많지 않았습니다 .
이 계산 된 값을보고하는 것이 일반적 / 모범 사례 p < 0.000000000000001
입니까, 아니면 다른 것 (예 :)을보고하는 것이 더 일반적인 가요?
몇몇 테스트에서 R
, 온 하한치가 P 값 의 계산 . 그 이유가 무엇인지, 또는 임의의 이유인지 확실하지 않습니다. 다른 많은 통계 패키지는로 이동 0.0001
하므로 훨씬 높은 수준의 정밀도입니다. 그러나 또는 보고하는 논문이 너무 많지 않았습니다 .
이 계산 된 값을보고하는 것이 일반적 / 모범 사례 p < 0.000000000000001
입니까, 아니면 다른 것 (예 :)을보고하는 것이 더 일반적인 가요?
답변:
그럴만한 이유가 있습니다.
값은 다음을 통해 찾을 수 있습니다 noquote(unlist(format(.Machine)))
double.eps double.neg.eps double.xmin
2.220446e-16 1.110223e-16 2.225074e-308
double.xmax double.base double.digits
1.797693e+308 2 53
double.rounding double.guard double.ulp.digits
5 0 -52
double.neg.ulp.digits double.exponent double.min.exp
-53 11 -1022
double.max.exp integer.max sizeof.long
1024 2147483647 4
sizeof.longlong sizeof.longdouble sizeof.pointer
8 12 4
도움말을 보면 ( ?".Machine"
) :
double.eps
the smallest positive floating-point number x such that 1 + x != 1. It equals
double.base ^ ulp.digits if either double.base is 2 or double.rounding is 0;
otherwise, it is (double.base ^ double.ulp.digits) / 2. Normally 2.220446e-16.
값이 작을수록 수치 적으로 의미가 없다고 확신 할 수있는 값은 본질적으로 그보다 작습니다. 더 작은 값은 계산하려는 값의 정확한 계산이 아닐 수 있습니다. (특정 절차에 의해 수행 된 계산에 따라 약간의 수치 분석을 연구했지만 수치 적 의미가 그 이상으로 공정한 방식으로 올 가능성이 높습니다.)
그러나 통계적 의미는 훨씬 일찍 사라졌습니다. p- 값은 가정에 따라 달라지며 극단적 인 꼬리로 갈수록 실제 p- 값이 계산할 때 명목상의 값이 아닌 실수 값에 더 크게 영향을받을 수 있습니다. '조금 틀렸어. 가정이 모두 정확하게 만족되지는 않기 때문에, 중간 p- 값은 비교적 정확할 수 있지만 (상대적인 정확도 측면에서, 아마도 약간의 분수에 의해서만 가능함) 매우 작은 p- 값은 많은 차수에 의해 나올 수 있습니다. 크기.
즉, 일반적인 관행 (패키지에서 일반적으로 말하는 "<0.0001"또는 Jaap이 그의 대답에서 언급 한 APA 규칙)은 현명한 관행과는 거리가 멀지 만 사물이 대략적으로 나타나는 지점 일 것입니다. ' 매우 작다 ' 라는 말을 넘어서는 의미 는 물론 상황에 따라 크게 달라질 수 있습니다.
이것이 내가 일반적인 규칙을 제안 할 수없는 한 가지 이유입니다. 모든 상황에서 모든 사람에게 원격으로 적합한 단일 규칙이있을 수는 없습니다. 상황을 약간 변경하고 넓은 회색 선은 다소 의미있는 것에서 상대적으로 변화를 나타냅니다 무의미한 변화는 때때로 먼 길로 바뀔 것입니다.
당신이 (가 회귀의 예를 들면, 정확한 상황에 대한 충분한 정보를 지정한다면 이 많이 비선형, 그 이 독립 변수의 변화의 양 이 오류 용어의 종류와 의존의 양, 그 종류와 이분의 양, 이 형태의 오차 분포), 나는 당신이 공칭 p- 값과 비교하기 위해 '진정한'p- 값을 시뮬레이션 할 수 있으므로 공칭 값이 의미를 전달하기에 너무 다르다는 것을 알 수 있습니다.
그러나 이것이 진정한 p- 값을 시뮬레이트하기 위해 충분한 정보를 지정 했음에도 불구하고 두 번째 이유로 이어질 수 있습니다.
당신이보고하는 것은 사람들의 선호, 당신과 당신의 청중에 달려 있습니다. 제가 공칭에서 선을 그어야하고 싶다고 결정을 위해 당신이 상황에 대해 충분히 얘기 상상 의 (10) - (6) .
우리 자신의 선호도 기능을 제외하고는 잘 생각할 수도 있습니다. 가정의 실패의)에 넣어 수 당신이에 차단하기 위해 자신의 담요 규칙이 넣을 수에 제출할 저널의 편집자 (10) - (4) , 다음 저널에 넣을 수있는 반면 (10) - 3 과 다음은 일반적인 규칙이 없을 수도 있고 내가 얻은 특정 편집기가 내가 준 것보다 훨씬 낮은 값을 허용 할 수도 있지만 심판 중 하나가 특정 컷을 가질 수 있습니다!
선호 기능과 규칙에 대한 지식이없고 자신의 유틸리티에 대한 지식이없는 경우 어떤 조치를 취할 것인지에 대한 일반적인 선택을 어떻게 책임감있게 제안합니까?
나는 적어도 내가하는 일을 말할 수 있습니다 (그리고 이것이 당신에게 좋은 선택이라고 제안하지는 않습니다).
p- 값을 시뮬레이션하는 것 이외의 환경은 거의 없습니다. (I 수도 있고 패키지에 의해보고 된 값을 언급하지 않을 수 있습니다,하지만 난 그것보다 아무것도 다른하지 것이다 그것은 매우 작았습니다. 나는 보통 정확한 숫자의 무의미를 강조합니다). 가끔의 지역 어딘가에 값을 (10) - (5) 에 (10) - 4 그 p가보다 훨씬 적었다 말한다. 때로는 위에서 제안한대로 실제로 수행합니다 .p- 값이 가정에 대한 다양한 위반에 특히 민감한 지 확인하기 위해 시뮬레이션을 수행하십시오. 특히 내가 우려하는 특정 종류의 위반이있는 경우.
그것은 선택을 알리는 데 확실히 도움이되지만 시뮬레이션 결과를 사용하여 컷오프 값을 선택하고 다른 사람들이 자신의 것을 선택할 수있는 기회를 제공하는 것에 대해 논의 할 것입니다.
시뮬레이션의 대안은 다양한 잠재적 가정 실패에 대해보다 강력한 * 절차를보고 p- 값에 얼마나 큰 차이가 있는지 확인하는 것입니다. 이들의 p- 값도 특별히 의미가 없지만, 최소한의 영향이 어느 정도인지는 알 수 있습니다. 일부가 명목상의 것과 매우 다른 경우, 또한 영향을 조사하기 위해 가정을 위반 하는 아이디어 를 더 많이 제공합니다 . 이러한 대안을보고하지 않더라도 작은 p- 값이 얼마나 의미가 있는지 더 잘 알 수 있습니다.
* 여기서는 일부 가정에 대한 중대한 위반에 대해 강력한 절차가 필요하지 않습니다. 이 가정에서는 관련 가정의 비교적 경미한 편차에 의해 영향을 덜받는 것이 좋습니다.
아주 경미한 위반으로도 그러한 시뮬레이션을 수행 할 때 작은 p- 값이 얼마나 잘못 될 수 있는지는 놀랄 수 있습니다. 그것은 내가 사용할 수있는 특정 컷오프를 이동시킨 것보다 p- 값을 개인적으로 해석하는 방식을 바꾸는 데 더 많은 일을했습니다.
실제 가설 검정 결과를 저널에 제출할 때 규칙이 있는지 알아 봅니다. 그렇지 않은 경우, 나는 제 자신을 기쁘게하는 경향이 있으며, 심판이 불평하기를 기다립니다.
일반적인 관행은 연구 분야에 따라 다릅니다. 가장 많이 사용되는 인용 스타일 중 하나 인 미국 심리 학회 (APA)의 매뉴얼은 다음과 같습니다 (p. 139, 6 판).
보다 작은 값을 사용하지 마십시오 p <0.001
이러한 극도의 p- 값은 유전체학 및 공정 모니터링과 같이 대량의 데이터가있는 분야에서 더 자주 발생합니다. 이 경우 때때로 -log 10 (p-value)으로 보고됩니다 . 예를 들어 p 값이 1e-26으로 내려가는 Nature의이 그림을 참조하십시오 .
-log 10 (p- 값)은 JMP에서 작업하는 통계 전문가 가 "LogWorth"라고 합니다.
R에서 "<2e-16"은 문자 그대로 <2e-16을 의미하는 것이 아니라 R이 기록하거나 표시 할 수 없을 정도로 값이 작다는 의미입니다.
회귀 테스트에서 종종 p가 4.940656e-324만큼 작습니다. "<2e-16"을 출력 할 때 이는 4.940656e-324보다 훨씬 작은 수입니다.
<2e-16
되면 값 이2e-16
문자 보다 작습니다 .
format.pval
보거나 간단히 사용해보십시오 format.pval(1e-16)
.