이제 짝을 이루지 않은 t- 검정과 관련 p- 값에 대해 걱정하는 것이 훨씬 더 잘 이해합니다. 알아내는 것은 흥미로운 여정이었으며 그 과정에서 많은 놀라움이있었습니다. 마이클의 공헌에 대한 조사에서 한 가지 놀라운 결과가 나왔습니다. 실제적인 조언으로는 돌이킬 수 없습니다. 또한, 나는 거의 모든 통계 학자들이 믿는다 고 생각하며이를 뒷받침 할 몇 가지 공감대를 가지고 있습니다. 그러나 이론으로는 말 그대로 정확하지 않습니다. 나는 p- 값에 대한 공식을 계산 한 다음 공식을 사용하여 반대 사례를 만드는 방법을 신중하게 생각함으로써 이것을 발견했습니다. 저는 훈련을받은 수학자이고, 반대 사례는 "수학자의 반대 사례"입니다. 실제 통계에서 볼 수있는 것은 아닙니다. 내가 원래의 질문을 할 때 알아 내려고했던 것의 종류.
반대 예를 제공하는 R 코드는 다음과 같습니다.
vLength <- 10; meanDiff <-10^9; numSamples <- 3;
pv <- function(vLength,meanDiff) {
X <- rnorm(vLength)
Y <- X - meanDiff + rnorm(vLength,sd=0.0001)
Paired <- t.test(X,Y,var.equal=T,paired=T)
NotPaired <- t.test(X,Y,var.equal=T,paired=F)
c(Paired$p.value,NotPaired$p.value,cov(X,Y))
}
ans <- replicate(numSamples,pv(vLength,meanDiff))
다음 기능을 참고하십시오. X와 Y는 차이가 크고 거의 일정한 두 개의 10- 튜플입니다. 많은 유의미한 수치에서 상관 관계는 1.000입니다 .... 비 페어링 테스트의 p- 값은 페어링 된 테스트의 p- 값보다 약 10 ^ 40 배 작습니다. 따라서 이것은 마이클의 설명과 모순됩니다. 마이클의 대답과 관련된 내 대답의 일부는 여기에서 끝납니다.
다음은 베드로의 대답으로 얻은 생각입니다. 원래의 질문에 대해 토론하면서, 나는 다르게 들리는 p- 값의 두 가지 특정 분포가 실제로 동일하다는 의견을 추측했습니다. 나는 이것을 증명할 수있다. 더 중요한 것은 증명이 p- 값의 기본 특성을 나타내므로 텍스트가 설명 할 필요가 없도록 근본적인 것입니다. 아마도 모든 전문 통계 학자들은 그 비밀을 알고있을 것입니다. 그러나 저에게 p- 값의 정의는 항상 이상하고 인공적으로 보였습니다. 통계학 자의 비밀을 알려주기 전에 질문을 구체적으로 설명하겠습니다.
n > 1엔2 ( n - 1 )n - 1자유도. 이 두 분포는 다르므로 지구상에서 관련된 p- 값 분포는 어떻게 동일 할 수 있습니까? 훨씬 더 깊이 생각한 후에야, 추측에 대한이 명백한 해고가 너무 쉽다는 것을 깨달았습니다.
에프: ( 0 , ∞ ) → ( 0 , ∞ )[ 0 , 1 ]
p = ∫∞티에프( s )디에스
에프( − ∞ , ∞ )[ 0 , ∞ )
[ 0 , 1 ]
n - 1[ 0 , 1 ]2 ( n - 1 )[ 0 , 1 ][ 0 , 1 ]