Durbin-Watson을 제외하고 어떤 가설 테스트로 결정적이지 않은 결과를 얻을 수 있습니까?


10

더빈 - 왓슨 통계량은 그것을 거부하거나 (제로 자기 상관이 경우) 귀무 가설을 기각 할 실패하거나 가능하지 않은 결정적 영역에 놓여있다.

"결정적이지 않은"결과를 얻을 수있는 다른 통계 테스트는 무엇입니까?

이 테스트 세트가 바이너리 "거부"/ "거부 실패"결정을 내릴 수없는 이유에 대한 일반적인 설명이 있습니까 (손을 흔들며하는 것이 좋습니까)?

후자의 질문에 대한 답변의 일부로 의사 결정 이론적 의미를 언급 할 수 있다면 보너스가 될 것입니다. 더 정교한 방식으로 오류?


2
주제를 벗어난 주제이지만 무작위 테스트는 맛이 있습니다. 일부 데이터 값의 경우 수락 및 거부에 대해 임의 화해야합니다.
Christoph Hanck

@ChristophHanck 덕분에, 그것은 내가 알지 못했던 흥미로운 연결이었습니다. 내가 의도 한 것은 아니지만, 나는 의도적으로 질문을 모호하게 유지하고 있었다. 대답에 따라 나중에 초점을 강화할 수있다.
Silverfish

답변:


10

위키 백과 문서는 귀무 가설 하에서 검정 통계량의 분포가 회귀 분석에 사용 된 예측 값의 디자인 매트릭스 특정 구성에 따라 달라집니다한다고 설명한다. 더빈 및 왓슨 양의 자기 상관 관계에 대한 테스트를 위해, 소정의 유의 수준에서 버려야하는하에 통계량에 대한 하한 계산 모든 테스트가 거부하지 해야하는 위에 디자인 매트릭스, 상한 어떤 디자인 매트릭스. "결정적이지 않은 영역"은 명확한 매트릭스를 고려하여 정확한 답을 얻기 위해 정확한 임계 값을 계산해야하는 영역 일뿐입니다.

t- 통계량 만 알면 표본 크기가 아닌 단일 표본 단측 t- 검정을 수행해야하는 유사한 상황이 발생합니다 . : 1.645 및 6.31 (무한 자유도 및 단 하나에 해당)은 다음과 같습니다. 0.05 크기의 테스트 범위.

의사 결정 이론이 진행되는 한 샘플링 변동 외에도 고려해야 할 새로운 불확실성의 원천이되었지만 복합 귀무 가설과 같은 방식으로 적용해서는 안되는 이유는 알 수 없습니다. 당신은 당신이 어떻게 도착했는지에 관계없이 알 수없는 방해 매개 변수를 가진 사람과 같은 상황에 있습니다. 따라서 모든 가능성에 대해 제 1 종 오류를 통제하면서 거부 / 유지 결정을해야하는 경우 보수적으로 거부하십시오 (즉, Durbin–Watson 통계가 하한 또는 t- 통계가 6.31을 초과하는 경우).

† 아니면 테이블을 잃어 버렸을 수도 있습니다. 그러나 표준 가우스에 대한 몇 가지 중요한 값과 Cauchy Quantile 함수에 대한 공식을 기억할 수 있습니다.


(+1) 감사합니다. 나는 이것이 Durbin-Watson 테스트의 경우라는 것을 알고 있었지만 (내 질문에 실제로 언급해야 함) 이것이 더 일반적인 현상의 예인지, 그렇다면 모두 본질적으로 동일한 방식으로 작동하는지 궁금해했습니다. 예를 들어, 회귀 분석이 아닌 요약 데이터에만 액세스 할 수있는 동안 특정 테스트를 수행 할 때 발생할 수 있지만 DW는 상위 및 하위 임계 값을 컴파일하고 표로 표시하는 것을 기억할 수있는 유일한 경우입니다. . 내가 질문을 더 잘 목표로 삼을 수있는 방법에 대한 생각이 있다면 매우 환영받을 것입니다.
Silverfish

첫 번째 질문은 약간 모호하지만 ( "다른 통계 테스트 [...]?"), 두 번째 질문에 답하지 않고 설명 할 수 없다고 생각합니다 ( "일반적인 설명이 있습니까? ..."?). 너 자신-전체적으로 나는 그것이 서있는 것처럼 괜찮다고 생각한다.
Scortchi-Monica Monica 복원

7

결정적이지 않은 결과가있는 테스트의 또 다른 예는 샘플 크기가 아닌 비율 만 사용할 수있는 경우 비율에 대한 이항 테스트입니다. 이것은 완전히 비현실적이지는 않습니다. 우리는 종종 "73 %의 사람들이 동의합니다 ..."와 같은 형식의 주장이 잘못보고 된 것을 보거나 듣습니다.

예를 들어, 샘플 비율 이 가장 가까운 전체 퍼센트로 반올림 된 것만 알고 있고 수준 에서 에 대해 를 테스트하려고 합니다.H0:π=0.5H1:π0.5α=0.05

관측 된 비율이 이면 관측 된 비율의 표본 크기는 19 이상이어야합니다. 는 분모가 가장 낮은 분수이므로 반올림하기 때문 입니다. 관찰 된 성공 횟수가 실제로 19 개 중 1 개, 20 개 중 1 개, 21 개 중 1 개, 22 개 중 1 개, 22 개 중 1 개, 37 개 중 2 개, 38 개 중 2 개, 55 개 중 3 개, 5 개 중 5 개 1000 개 중 100 개 또는 50 개 ...하지만 둘 중 어느 쪽이든 결과는 수준 에서 중요 합니다.p=5%1195%α=0.05

반면에 표본 비율이 라는 것을 알면 관찰 된 성공 횟수가 100 개 중 49 개 (이 수준에서는 중요하지 않음)인지 10,000 개 중 4900 개인 지 의미를 얻습니다). 따라서이 경우 결과는 결정적이지 않습니다.p=49%

참고 함께 둥근 심지어 : 백분율 아니오 영역 "거부에 실패"없다 2 개 시험 중 1 개 성공 등 49,500 거부 초래 100,000 아웃 성공뿐만 아니라, 시료 등의 샘플과 일치 을 거부하지 못하게됩니다 .p=50%H0

더빈-왓슨 (Durbin-Watson) 테스트와 달리 나는 백분율이 중요한 표로 작성된 결과를 본 적이 없다. 임계 값에 대한 상한 및 하한이 없으므로이 상황은 더 미묘합니다. 의 결과 는 명백히 결정적이지 못합니다. 한 번의 시험에서 0 번의 성공은 미미하지만 백만 번의 시험에서 큰 성공은 없을 것이기 때문입니다. 우리는 이미 가 결정적이지 않지만 그 사이에 와 같은 중요한 결과 가 있음을 이미 보았다 . 또한 컷오프가 없다는 것은 및 의 예외적 인 경우 때문이 아닙니다 . 해당하는 가장 중요하지 않은 샘플을 약간 재생p=0%p=50%p=5%p=0%p=100%p=16%19의 샘플에서 성공으로,이 경우 이므로 중요합니다. 에 대한 우리는 미미 6 개 시험에서 1 개 성공이있을 수 있습니다, 이 경우는 (와 분명히 다른 샘플이 있기 때문에 결정적 그래서 되는 중요 할 것이다); 위한 11 개 시험 2 개의 성공이 될 수도있다 (사소한 )이 경우도 불확실하므로; 그러나 경우 최소 가능성이 가장 적은 샘플은 하여 19 번의 시도에서 3 회 성공 하므로 다시 중요합니다.Pr(X3)0.00221<0.025p=17%Pr(X1)0.109>0.025p=16%p=18%Pr(X2)0.0327>0.025p=19%Pr(X3)0.0106<0.025

실제로 는 50 % 미만의 가장 높은 반올림 백분율로 5 % 수준에서 분명하게 중요합니다 (최고의 p- 값은 17 번의 시도에서 4 번의 성공에 해당하며 단지 유의미 함). 결론은 결정적이지 않은 0이 아닌 가장 낮은 결과입니다 (8 회 시도에서 1 회 성공할 수 있기 때문에). 위의 예에서 볼 수 있듯이 사이에서 일어나는 일이 더 복잡합니다! 아래 그래프는 빨간색 선이 있습니다. 선 아래의 점은 확실하지만 그 위의 점은 결정적이지 않습니다. p- 값의 패턴은 결과가 명백하게 의미있는 것으로 관찰 된 백분율에 대한 단일 하한 및 상한이 존재하지 않도록하는 것이다.p=24%p=13%α=0.05

표본 크기를 알 수없는 최소 이항 검정 p- 값

R 코드

# need rounding function that rounds 5 up
round2 = function(x, n) {
  posneg = sign(x)
  z = abs(x)*10^n
  z = z + 0.5
  z = trunc(z)
  z = z/10^n
  z*posneg
}

# make a results data frame for various trials and successes
results <- data.frame(successes = rep(0:100, 100),
    trials = rep(1:100, each=101))
results <- subset(results, successes <= trials)
results$percentage <- round2(100*results$successes/results$trials, 0)
results$pvalue <- mapply(function(x,y) {
    binom.test(x, y, p=0.5, alternative="two.sided")$p.value}, results$successes, results$trials)

# make a data frame for rounded percentages and identify which are unambiguously sig at alpha=0.05
leastsig <- sapply(0:100, function(n){
    max(subset(results, percentage==n, select=pvalue))})
percentages <- data.frame(percentage=0:100, leastsig)
percentages$significant <- percentages$leastsig
subset(percentages, significant==TRUE)

# some interesting cases
subset(results, percentage==13) # inconclusive at alpha=0.05
subset(results, percentage==24) # unambiguously sig at alpha=0.05

# plot graph of greatest p-values, results below red line are unambiguously significant at alpha=0.05
plot(percentages$percentage, percentages$leastsig, panel.first = abline(v=seq(0,100,by=5), col='grey'),
    pch=19, col="blue", xlab="Rounded percentage", ylab="Least significant two-sided p-value", xaxt="n")
axis(1, at = seq(0, 100, by = 10))
abline(h=0.05, col="red")

(반올림 코드는 이 StackOverflow 질문에서 제외 됩니다.)

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.