누군가 p- 값이 문제라는 것을 학생들에게 가르치는 것이 좋지 않은 이유에 대한 간결한 설명을 제공 할 수 있습니까? 내 이해는 p- 값이 prob라는 것입니다 (더 극단적 인 데이터 얻기 | 귀무 가설이 참임).
나의 진짜 관심은 그들에게 전자가 그것을 말하는 것의 해로움 이다 (단순하지 않다는 사실을 제외하고).
누군가 p- 값이 문제라는 것을 학생들에게 가르치는 것이 좋지 않은 이유에 대한 간결한 설명을 제공 할 수 있습니까? 내 이해는 p- 값이 prob라는 것입니다 (더 극단적 인 데이터 얻기 | 귀무 가설이 참임).
나의 진짜 관심은 그들에게 전자가 그것을 말하는 것의 해로움 이다 (단순하지 않다는 사실을 제외하고).
답변:
@Karl과는 다른 잘못된 진술의 의미에 대한 해석이 다릅니다. 나는 그것이 null에 관한 것이 아니라 데이터에 관한 진술이라고 생각합니다. 우연히 견적을받을 확률을 묻는 것으로 이해합니다. 나는 그것이 무엇을 의미하는지 잘 모르겠습니다. 잘 정의 된 주장이 아닙니다.
그러나 실제 추정치가 특정 값과 같다면 우연히 내 추정치를 얻을 확률이 무엇을 의미하는지 이해합니다. 예를 들어, 평균 키가 실제로 동일하다는 점을 감안할 때 남성과 여성의 평균 키 차이가 매우 큰 것이 무엇을 의미하는지 이해할 수 있습니다. 잘 지정되어 있습니다. 이것이 바로 p- 값이 제공하는 것입니다. 잘못된 문장에서 빠진 것은 널이 참이라는 조건입니다.
이제 우리는 이것이 완벽하지 않다고 반대 할 수도 있습니다 (예를 들어, 추정기의 정확한 값을 얻을 가능성은 0입니다). 그러나 대부분 p- 값을 해석하는 방식보다 훨씬 낫습니다.
가설 검정을 가르 칠 때 반복해서 말하는 핵심 요점은 "1 단계는 귀무 가설이 참이라고 가정하는 것입니다.이 가정에 따라 모든 것이 계산됩니다." 사람들이 그것을 기억한다면 꽤 좋습니다.
나는이 해석을 많이 보았습니다 (아마도 올바른 해석보다 더 자주). "그 결과는 [무작위] 확률로 인한 것입니다"는 " 은 (는) 참" 으로 해석 하므로 실제로는 입니다. 실제로 이어야합니다 ; 말하자면, (당신이 할당 전과 기꺼이과 베이 즈를 할 경우)이 의미있는 진술 할 수있다] "우리가 (데이터)를 본 것을 주어진 유일한 기회가 작동 할 확률은? 무엇인가", 하지만 그것은 P 아니다 -value .
는 p- 값과 상당히 다를 수 있으므로 p- 값을 그런 식으로 해석하면 잘못 오도 될 수 있습니다.
가장 간단한 예 : 이전의 은 매우 작지만 데이터는 적기 때문에 p- 값은 게으르지 만 (예 : 0.3), 후자는 는 여전히 작습니다. [그러나이 예제는 그리 흥미롭지 않을 것입니다.]
나는 (ex) 학생 관점에서 늦은 답변을 추가 할 것입니다 : IMHO 피해는 잘못과 분리 될 수 없습니다.
이러한 유형의 잘못된 "과업 적 근사 / 바로 가기"는 문장을 논리적으로 이해할 수 없다는 것을 인식하는 학생들에게는 혼란을 야기 할 수 있지만, 그들에게 배운 것이 옳다고 가정하면 이해할 수 없다는 것을 깨닫지 못합니다 옳지 않기 때문입니다.
이것은 단지 그들에게 제시된 규칙을 암기하는 학생들에게는 영향을 미치지 않습니다. 그러나 이해를 통해 배우는 학생들은 충분히 능숙해야합니다.
유효한 교훈적인 지름길이 없다고 말하는 것은 아닙니다. 그러나 IMHO는 그러한 지름길을 취했을 때 이것을 언급해야한다 (예를 들어, "논쟁의 용이성을 위해 우리는 그것을 추정 / 대략 ...").
그러나이 특별한 경우에는 사용하기에 너무 오도 된 것으로 생각합니다.
다음은 내가 사용하는 간단한 예입니다.
우리의 귀무 가설이 2 머리 동전을 뒤집고 있다고 가정합니다 (따라서 prob (heads) = 1). 이제 우리는 동전을 한 번 뒤집어서 머리를 얻습니다. 이에 대한 p- 값은 1입니다. 따라서 우리는 두 머리 동전을 가질 확률이 100 %입니까?
까다로운 점은 꼬리를 뒤집 으면 p- 값은 0이되고 2- 머리 동전을 가질 확률은 0이되므로이 경우에는 일치하지만 위와는 일치하지 않습니다. 위의 p- 값 1은 우리가 관찰 한 것이 쌍두 동전의 가설과 완벽하게 일치한다는 것을 의미하지만 동전이 쌍두라는 것을 증명하지는 않습니다.
또한 빈번한 통계를 수행하는 경우 귀무 가설은 True 또는 False (무엇인지 알 수 없음)이며 귀무 가설에 대한 (빈번한) 확률 진술은 의미가 없습니다. 가설의 확률에 대해 이야기하려면 적절한 베이지안 통계를 수행하고, 베이지안 확률 정의를 사용하고, 사전으로 시작하여 가설이 참인 사후 확률을 계산하십시오. p- 값을 베이지안 후부와 혼동하지 마십시오.
좋아, 또 다른 약간 다른 점이 있습니다.
첫 번째 기본 문제는 "[무작위로 인한] 우연한"이라는 문구입니다. 불특정 한 '기회'에 대한 아이디어는 자연스럽게 학생들에게 제공되지만, 현명한 통계를 수행하는 데있어 불확실성과 재앙에 대해 명확하게 생각하는 것은 위험합니다. 일련의 코인 플립과 같은 방식으로 확률은 0.5 확률로 이항식 설정으로 설명됩니다. 확실한 것은 당연하지만 통계적인 관점에서 0.6 또는 다른 것을 가정하는 것보다 더 자연 스럽지는 않습니다. 그리고 실제 매개 변수를 포함하는 다른 '명백하지 않은'예의 경우 '기회'가 어떻게 보이는지 생각하는 것은 전혀 도움이되지 않습니다.
문제와 관련하여 핵심 아이디어는 H0에 의해 어떤 종류 의 '기회'가 설명되는지, 즉 실제 가능성 / DGP H0 이름이 무엇인지 이해하는 것 입니다. 일단 그 개념이 확립되면, 학생들은 마침내 '우연히'일어나는 일들에 대해 이야기하는 것을 멈추고 실제로 H0가 무엇인지 묻기 시작합니다. (또한 그들은 다양한 Hs와 일관 될 수 있으므로 역 테스트를 통해 신뢰 구간을 먼저 시작할 수 있음을 알아냅니다.)
두 번째 문제는 피셔의 p- 값 정의로가는 길에 데이터가 H0과의 일관성 측면에서 항상 먼저 설명해야한다는 점입니다. 꼬리 영역은 일종의 '기회'활동으로 (또는 솔직히 해석하기 위해). 이것은 분명히 수사적 강조의 문제이지만 도움이 될 것 같습니다.
요컨대, 사물을 묘사하는 이러한 방식은 그들이 생각하려고 시도하는 사소한 모델로 일반화되지 않을 것입니다. 최악의 경우, 통계 연구가 이미 그런 종류의 묘사가 목표로하는 사람들의 종류에서 이미 생성된다는 미스터리를 더할 수 있습니다.
"p- 값은 우연에 의한 영향의 확률"이라고 생각하면 우연에 의한 영향을 의미하는 것으로 보입니다. 그러나 모든 효과는 부분적으로 우연입니다. 임의의 변동성을 통해보아야 할 필요성을 설명하는 통계 수업에서 이것은 매우 마술적이고 지나친 진술입니다. 그것은 p- 값에 가지고 있지 않은 힘을 부여합니다.
특정 경우에 확률을 귀무 가설로 정의하면 p- 값이 귀무 가설로 인해 관측 된 효과가 발생할 확률이 산출됩니다. 그것은 정확한 진술에 끔찍하게 보이지만 확률에 대한 조건이 그 가능성의 원인이라고 주장하는 것은 다시 한 번 넘어집니다. p- 값이 귀무 가설이 참인 경우 효과의 확률이라는 정확한 진술은 귀무 효과를 야기하지 않습니다. 원인은 실제 효과, 효과 주변의 변동성 및 임의 확률을 포함하여 다양합니다. p- 값은 이러한 확률을 측정하지 않습니다.