양측 테스트 설명


16

나는 학생들에게 (초등 통계 과정에서) 양측 검정이 무엇인지, 그리고 P 값이 어떻게 계산되는지 설명하는 다양한 방법을 찾고 있습니다.

학생들에게 양측 및 단측 테스트를 어떻게 설명합니까?

답변:


17

이것은 훌륭한 질문이며 p- 값과 양측 대 단측 테스트를 설명하는 모든 사람들에게 기대됩니다. 나는 동료 정형 외과 의사 통계를 가르치고 있었기 때문에 10-30 년 동안 대부분의 고급 수학을 수행하지 않았기 때문에 최대한 기본적으로 유지하려고 노력했습니다.

p- 값 및 꼬리 계산을 설명하는 방법

우리가 공정한 동전을 가지고 있다고 생각하면 평균적으로 뒤집기의 50 %를 꼬리로 끝내야한다는 것을 설명하면서 시작합니다 ( ). 이제이 공정한 동전으로 10 개의 꼬리 중 2 개의 꼬리 만 가져올 확률이 궁금하다면 막대 그래프에서 한 것처럼 그 확률을 계산할 수 있습니다. 그래프에서 당신은 공정한 동전으로 10 번의 플립에서 8 번의 플립을 얻을 확률이 약 4.4 % 임을 알 수 있습니다 .=H04.4%

우리가 9 개 또는 10 개의 꼬리를 가졌다면 동전의 공정성에 의문을 가질 것이기 때문에 테스트의 꼬리 인 이러한 가능성을 포함시켜야합니다. 값을 추가함으로써 우리는 확률이 이제 조금 더 이상의 것을 얻을 이하 2 개 꼬리에 걸릴.5.5%

이제 우리가 2 개의 머리, 즉 8 개의 머리 (다른 꼬리)만을 얻는다면, 아마도 동전의 공정성에 의문을 가질 것입니다. 이것은 양측 검정에 대해 의 확률로 끝나는 것을 의미합니다 .5.4 ...%+5.4 ...%10.9%

의학 분야에서 우리는 일반적으로 실패 연구에 관심이 있기 때문에, 우리의 의도가 선을 행하고 유익한 치료법을 도입하더라도 확률의 반대편을 포함해야합니다.

내리고있는 동전 그래프

주제에서 약간 벗어난 반사

이 간단한 예는 또한 p- 값을 계산하기 위해 귀무 가설에 얼마나 의존하는지 보여줍니다. 또한 이항 곡선과 종 곡선의 유사점을 지적하고 싶습니다. 200 플립으로 바꿀 때 정확히 100 플립을 얻을 확률이 관련성이 부족하기 시작하는 이유를 자연스럽게 설명 할 수 있습니다. 관심 구간을 정의하는 것은 확률 밀도 / 질량 함수 함수 및 해당 누적 함수로 자연스럽게 전환하는 것입니다.

우리 반에서는 칸 아카데미 통계 비디오를 추천하고 특정 개념에 대한 그의 설명 중 일부를 사용합니다. 그들은 또한 동전 뒤집기의 무작위성을 조사 할 때 동전을 뒤집습니다. 제가 보여 드리려고하는 것은 무작위성이 우리 가이 Radiolab 에피소드에서 영감을받은 것으로 생각하는 것보다 무작위라는 것 입니다.

코드

일반적으로 그래프를 만들 때 사용한 R 코드 인 하나의 그래프 / 슬라이드가 있습니다.

library(graphics)

binom_plot_function <- function(x_max, my_title = FALSE, my_prob = .5, edges = 0, 
                                col=c("green", "gold", "red")){
  barplot(
    dbinom(0:x_max, x_max, my_prob)*100, 
    col=c(rep(col[1], edges), rep(col[2], x_max-2*edges+1), rep(col[3], edges)),
    #names=0:x_max,
    ylab="Probability %",
    xlab="Number of tails", names.arg=0:x_max)
  if (my_title != FALSE ){
    title(main=my_title)
  }
}

binom_plot_function(10, paste("Flipping coins", 10, "times"), edges=0, col=c("#449944", "gold", "#994444"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", "gold"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", rgb(200/255, 100/255, 100/255)))

위대한 답변 Max-그리고 내 질문의 사소하지 않은 점을 인정해 주셔서 감사합니다 :)
Tal Galili

+1 좋은 답변, 매우 철저합니다. 저를 용서하십시오, 그러나 나는 두 가지에 대해 nitpick하려고합니다. 1) p- 값은 데이터가 null 미만의 데이터보다 극단적이거나 더 극단적 일 확률로 이해되므로 귀하의 답변이 옳습니다. 그러나 코인 플립과 같은 개별 데이터를 사용할 때는 부적절하게 보수적입니다. "중간 p- 값"이라고하는 것을 사용하는 것이 가장 좋습니다. 즉, 데이터 확률의 1/2만큼 데이터 확률 + 데이터의 확률이 더 극단적입니다. 이러한 문제에 대한 쉬운 설명은 Agresti (2007) 2.6.3에서 찾을 수 있습니다. (계속)
gung-Reinstate Monica

2) 당신은 우리가 생각하는 것보다 무작위성이 더 무작위 적이라고 말합니다. 나는 그것이 당신이 의미하는 바를 추측 할 수 있습니다 (나는 당신이 링크하는 Radiolab 에피소드를들을 기회가 없었지만, 그럴 것입니다). 흥미롭게도 나는 항상 학생들에게 무작위성이 당신이 생각하는 것보다 덜 무작위 적이라고 말했습니다. 여기서는 줄무늬에 대한 인식 (예 : 도박)을 말합니다. 사람들은 무작위 사건이 실제 사건보다 훨씬 더 많이 번갈아 가야한다고 생각하고 결과적으로 줄무늬를 보게됩니다. Falk (1997) Randomness의 의미 만들기 Psych Rev 104,2를 참조하십시오 . 다시 말하지만, 당신은 틀린 것이 아닙니다. 단지 생각을위한 음식입니다.
gung-Monica Monica 복원

의견을 보내 주셔서 감사합니다. 나는 실제로 p-pvalue에 대해 들어 본 적이 없습니다. 기본 통계를 가르 칠 때 언급 할 내용이 무엇인지 잘 모르겠습니다. 제가 제공하려고하는 실제 느낌을 잃어 버릴 수 있기 때문입니다. 임의성에 관해서는 정확히 같은 의미입니다. 진정으로 임의의 숫자를 볼 때 패턴이 있다고 생각합니다. 나는 Freakonomics 팟 캐스트의 어리 석음에 대해 들었습니다 .
Max Gordon

... 인간의 마음은 포식자를 감지하지 못하는 것이 아마도 아무것도 아닌 것으로 생각하는 것보다 비용이 많이 든다는 것을 수년에 걸쳐 배웠습니다. 나는 그 비유가 마음에 들며 동료들에게 통계를 사용하는 주된 이유 중 하나는 우리 모두가 낳은이 결함을 해결하는 데 도움이된다고 말합니다.
Max Gordon

9

남성의 평균 키가 "5 ft 7 인치"라는 가설을 검정한다고 가정합니다. 남성의 무작위 표본을 선택하고 신장을 측정하고 표본 평균을 계산합니다. 귀하의 가설은 다음과 같습니다.

H0:μ=5 피트 7 신장

H:μ5 피트 7 신장

위의 상황에서 샘플 평균이 너무 낮거나 너무 높으면 null을 거부하므로 양측 테스트를 수행합니다.

이 경우, p- 값은 null이 실제로 참이라고 가정하고 실제로 얻은 것 이상으로 극단적 인 표본 평균을 실현할 확률을 나타냅니다 . 따라서 표본 평균이 "5 ft 8 인치"인 경우 p- 값은 "5 ft 8 인치"보다 큰 높이 또는 "5 ft 6 인치"보다 작은 높이를 관측 할 확률을 나타냅니다. 사실이다.

반면에 대안이 다음과 같이 구성되어 있다면 :

H:μ>5 피트 7 신장

위 상황에서는 오른쪽에서 단측 테스트를합니다. 그 이유는 표본 평균이 매우 높은 경우에만 대안을 위해 null을 거부하는 것입니다.

p- 값의 해석은 실제로 얻은 평균보다 더 큰 표본 평균을 실현할 가능성에 대해 이야기하는 약간의 뉘앙스와 동일하게 유지됩니다. 따라서 표본 평균이 "5 ft 8 인치"인 경우 p- 값은 null이 true 인 경우 "5 ft 8 인치"보다 큰 높이를 관찰 할 확률을 나타냅니다.


2
이전에는 두 번째로 H 널은 읽어야한다 H0:μ5 피트 7 신장아니 H0:μ=5 피트 7 신장. 이 질문에 대한 @ whuber의 의견 중 하나를 참조하십시오. null 및 대체 가설이 철저해야합니까? .
chl

2
@chl 동의합니다. 그러나 통계적 아이디어를 처음 접하고있는 사람의 경우, p- 값 해석과 관련하여 사물이 어떻게, 왜 변화하는지에 초점이 맞춰지면 단측 테스트에 대해 null을 다시 작성하는 것이 방해가 될 수 있습니다.
varty

1
그럴 수 있지. 교육 목적으로도 언급 할 가치가 있습니다.
chl December
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.