답변:
이것은 훌륭한 질문이며 p- 값과 양측 대 단측 테스트를 설명하는 모든 사람들에게 기대됩니다. 나는 동료 정형 외과 의사 통계를 가르치고 있었기 때문에 10-30 년 동안 대부분의 고급 수학을 수행하지 않았기 때문에 최대한 기본적으로 유지하려고 노력했습니다.
우리가 공정한 동전을 가지고 있다고 생각하면 평균적으로 뒤집기의 50 %를 꼬리로 끝내야한다는 것을 설명하면서 시작합니다 ( ). 이제이 공정한 동전으로 10 개의 꼬리 중 2 개의 꼬리 만 가져올 확률이 궁금하다면 막대 그래프에서 한 것처럼 그 확률을 계산할 수 있습니다. 그래프에서 당신은 공정한 동전으로 10 번의 플립에서 8 번의 플립을 얻을 확률이 약 ≈ 4.4 % 임을 알 수 있습니다 .
우리가 9 개 또는 10 개의 꼬리를 가졌다면 동전의 공정성에 의문을 가질 것이기 때문에 테스트의 꼬리 인 이러한 가능성을 포함시켜야합니다. 값을 추가함으로써 우리는 확률이 이제 조금 더 이상의 것을 얻을 이하 2 개 꼬리에 걸릴.
이제 우리가 2 개의 머리, 즉 8 개의 머리 (다른 꼬리)만을 얻는다면, 아마도 동전의 공정성에 의문을 가질 것입니다. 이것은 양측 검정에 대해 의 확률로 끝나는 것을 의미합니다 .
의학 분야에서 우리는 일반적으로 실패 연구에 관심이 있기 때문에, 우리의 의도가 선을 행하고 유익한 치료법을 도입하더라도 확률의 반대편을 포함해야합니다.
이 간단한 예는 또한 p- 값을 계산하기 위해 귀무 가설에 얼마나 의존하는지 보여줍니다. 또한 이항 곡선과 종 곡선의 유사점을 지적하고 싶습니다. 200 플립으로 바꿀 때 정확히 100 플립을 얻을 확률이 관련성이 부족하기 시작하는 이유를 자연스럽게 설명 할 수 있습니다. 관심 구간을 정의하는 것은 확률 밀도 / 질량 함수 함수 및 해당 누적 함수로 자연스럽게 전환하는 것입니다.
우리 반에서는 칸 아카데미 통계 비디오를 추천하고 특정 개념에 대한 그의 설명 중 일부를 사용합니다. 그들은 또한 동전 뒤집기의 무작위성을 조사 할 때 동전을 뒤집습니다. 제가 보여 드리려고하는 것은 무작위성이 우리 가이 Radiolab 에피소드에서 영감을받은 것으로 생각하는 것보다 무작위라는 것 입니다.
일반적으로 그래프를 만들 때 사용한 R 코드 인 하나의 그래프 / 슬라이드가 있습니다.
library(graphics)
binom_plot_function <- function(x_max, my_title = FALSE, my_prob = .5, edges = 0,
col=c("green", "gold", "red")){
barplot(
dbinom(0:x_max, x_max, my_prob)*100,
col=c(rep(col[1], edges), rep(col[2], x_max-2*edges+1), rep(col[3], edges)),
#names=0:x_max,
ylab="Probability %",
xlab="Number of tails", names.arg=0:x_max)
if (my_title != FALSE ){
title(main=my_title)
}
}
binom_plot_function(10, paste("Flipping coins", 10, "times"), edges=0, col=c("#449944", "gold", "#994444"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", "gold"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", rgb(200/255, 100/255, 100/255)))
남성의 평균 키가 "5 ft 7 인치"라는 가설을 검정한다고 가정합니다. 남성의 무작위 표본을 선택하고 신장을 측정하고 표본 평균을 계산합니다. 귀하의 가설은 다음과 같습니다.
위의 상황에서 샘플 평균이 너무 낮거나 너무 높으면 null을 거부하므로 양측 테스트를 수행합니다.
이 경우, p- 값은 null이 실제로 참이라고 가정하고 실제로 얻은 것 이상으로 극단적 인 표본 평균을 실현할 확률을 나타냅니다 . 따라서 표본 평균이 "5 ft 8 인치"인 경우 p- 값은 "5 ft 8 인치"보다 큰 높이 또는 "5 ft 6 인치"보다 작은 높이를 관측 할 확률을 나타냅니다. 사실이다.
반면에 대안이 다음과 같이 구성되어 있다면 :
위 상황에서는 오른쪽에서 단측 테스트를합니다. 그 이유는 표본 평균이 매우 높은 경우에만 대안을 위해 null을 거부하는 것입니다.
p- 값의 해석은 실제로 얻은 평균보다 더 큰 표본 평균을 실현할 가능성에 대해 이야기하는 약간의 뉘앙스와 동일하게 유지됩니다. 따라서 표본 평균이 "5 ft 8 인치"인 경우 p- 값은 null이 true 인 경우 "5 ft 8 인치"보다 큰 높이를 관찰 할 확률을 나타냅니다.