Ziliak (2011)는 p- 값의 사용을 반대하고 몇 가지 대안을 언급합니다. 그들은 무엇인가?


25

통계적 추론에 대한 p- 값에 의존하는 단점에 대해 논의한 최근 기사에서 "매트릭스 v. 시라쿠사 노 및 학생 v. 피셔 통계적 유의성" (DOI : 10.1111 / j.1740-9713.2011.00511.x), Stephen T. Ziliak은 p- 값 사용에 반대합니다. 결론적 인 문단에서 그는 말한다 :

데이터는 우리가 이미 알고있는 것 중 하나입니다. 우리가 실제로 알고 싶은 것은 우리가 가진 데이터를 감안할 때 가설이 사실 (또는 적어도 실질적으로 유용 할) 가능성과는 매우 다릅니다. 우리는 이용 가능한 증거를 고려할 때 두 약물이 다를 가능성과 그 정도에 대해 알고 싶습니다. 피셔가 빠뜨린 함정이 전치 된 조건부 오류에 기초한 유의성 검정은 그러한 확률을 알려줄 수 없으며 알려줄 수 없습니다. Power 기능, 예상 손실 함수 및 Student 및 Jeffreys의 후손 인 많은 의사 결정 이론 및 베이지안 방법은 현재 널리 이용 가능하고 무료입니다.

거듭 제곱 함수, 예상 손실 함수 및 "기타 결정 이론 및 베이지안 방법"은 무엇입니까? 이 방법들이 널리 사용됩니까? 그들은 R에서 사용할 수 있습니까? 이러한 새로운 제안 된 방법은 어떻게 구현됩니까? 예를 들어, 이러한 방법을 사용하여 데이터 세트에서 가설을 검정하는 방법을 기존의 2- 표본 t- 검정 및 p- 값을 사용하는 방법은 무엇입니까?


값만 사용하는 것에 반대하는 많은 논문이 있지만 실제로는 상황, IMO에 달려 있습니다. 관심있는 내용에 대한 정보를 추가 할 수 있습니까 (마지막 문장 참조)? p
chl

2
이 기사에 액세스 할 수는 없지만이 주장은 진행중인 일에 대한 다소 결함이 있음을 나타냅니다. 잘못된 이해에도 불구하고 다른 통계를 고려할 가치가 있다는 결론은 합리적입니다. 예상 손실 함수는 단순히 손실 함수의 예상 (예 : 제곱 오차, 물류 등) 의 추정치입니다 .
반복자

답변:


17

혼란스러워하는 개인의 또 하나의 충격적인 종이처럼 들립니다. 피셔는 그러한 통계에 빠지지 않았지만 많은 통계학 학생들이 그러합니다.

가설 검정은 의사 결정 이론적 문제입니다. 일반적으로 두 결정 사이에 주어진 임계 값 (가설 참 또는 가설 거짓)으로 검정을 마칩니다. 단일 지점 (예 : 해당하는 가설이있는 경우 데이터가 참일 때 발생할 확률을 계산할 수 있습니다. 그러나 단일 지점이 아닌 경우 어떻게해야합니까? θ 의 함수를 얻습니다 . 가설 θ 0 은 그러한 가설이며, 관측 된 데이터가 사실 일 경우이를 생성 할 확률에 대한 함수를 얻게됩니다. 그 기능은 전원 기능입니다. 매우 고전적입니다. 피셔는 모든 것을 알고있었습니다.θ=0θθ0

예상 손실은 의사 결정 이론의 기본 메커니즘의 일부입니다. 다양한 자연 상태와 그로 인한 여러 가지 가능한 데이터 및 가능한 결정을 내릴 수 있으며 데이터에서 의사 결정에 이르기까지 훌륭한 기능을 찾고 싶습니다. 좋은 것을 어떻게 정의합니까? 획득 한 데이터를 기반으로 한 특정 자연 상태와 해당 절차의 결정에 따라 예상 손실은 무엇입니까? 이것은 비즈니스 문제에서 가장 간단하게 이해됩니다 (지난 3/4 분기에 관찰 한 판매량을 기준으로하는 경우 예상되는 금전적 손실은 무엇입니까?).

베이지안 절차는 결정 이론 절차의 일부입니다. 사소한 경우를 제외하고는 유일하게 최상의 절차를 명시하기에는 예상 손실이 충분하지 않습니다. 상태 A와 B 둘 다에서 한 절차가 다른 절차보다 낫다면 분명히 선호 할 것이지만, 상태 A에서 우수하고 상태 B에서 더 나은 절차를 선택하는 것은 무엇입니까? 이것은 베이 즈 절차, 최소 및 편견과 같은 부수적 인 아이디어가 들어오는 곳입니다.

ttαβpαp

Fisher가 Student의 작품을 널리 보급하는 데 책임이 있다고 생각하면서 왜 그가 Student와 Jeffreys를 함께 지명했는지에 대해 약간 혼란스러워합니다.

기본적으로 p- 값을 맹목적으로 사용하는 것은 나쁜 생각이며 다소 미묘한 개념이지만 쓸모없는 것은 아닙니다. 수학적 배경이 열악한 연구자들의 오용에 반대해야합니까? 물론 피셔가 현장에서 사람이 사용할 수 있도록 무언가를 증류하려고 시도 하기 전에 어떻게 생겼는지 기억합시다 .


5
실제로 질문에 대답하면 +1, 견적에 도전하기위한 추가 (가상) +1은 도발적이지만 문제가됩니다. 나는 당신이 여기에 최근에 참여한 것을 보았지만 이미 많은 답변에 기여했습니다 : 많은 감사와 우리 사이트에 약간 환영합니다!
whuber

자세한 답변에 감사드립니다. 이 백서에서 비판적으로 제안되는 대체 전략에 대해 생각하는 데 도움이됩니다. 나는 일부 동료들이이 논문을 사용하여 p- 값을 전혀 보지 말아야한다고 말했고이 대안들이 실제로 무엇을 의미하는지 이해하지 못한다는 것을 깨달았습니다. 설명해 주셔서 감사합니다!
Ariel

@ whuber 나는 이것이 질문에 전혀 대답하지 않는다고 생각합니다. OP는 Ziliak이 제안한 대안에 대해 묻고 있었지만이 답변으로 해결하지 못했습니다. 예를 들어, Ziliak의 중요성에 대한 비판은 사람들이 5 % 또는 1 %의 중요성을 사용하는 이유에 영향을줍니다. 확실한 이유는 없으며,이 수준을 Fisher의 논문으로 다시 추적 할 수있었습니다. 임의의 편리한 숫자 일뿐입니다. 금전적 우위, 즉 달러 가치에 기반한 "대체"접근법과 달리.
Aksakal

1
@ Aksakal 저는 가설 검정을 의사 결정 이론적 문제와 관련시키고 p- 값을 예상 위험에 명시 적으로 연결함으로써 대화에 중요한 기여를한다고 생각합니다 (0-1 손실 함수 기반).
whuber


5

레즈 당신이 사용하는 경우 패키지는 우도 비율을 제공하는 ezMixed()혼합 효과 모델링을 수행하는 기능. 우도 비는 두 모델의 우도 (관측 된 데이터 제공) : 현상의 영향을 0으로 제한하는 "제한된"모델과 0이 아닌 영향을 허용하는 "제한되지 않은"모델을 비교하여 현상에 대한 증거를 정량화하는 것을 목표로합니다. 현상. 모델의 차등 복잡성에 대한 관측 된 가능성을 수정 한 후 (교차 유효성 검사와 무관하게 Akaike의 Information Criterion을 통해)이 비율은 현상에 대한 증거를 정량화합니다.


4

이러한 모든 기술은 연필로 모든 대수학을 사용할 수있는 것과 동일한 의미로 R에서 사용할 수 있습니다. p- 값조차도 R의 많은 다양한 함수를 통해 사용할 수 있으므로 p- 값 또는 베이지안 후자를 얻는 데 사용할 함수가 단일 함수 또는 패키지에 대한 포인터보다 더 복잡하다는 결정입니다.

이러한 기술에 대해 배우고 실제로 어떤 대답을 원하는지 결정하면 R (또는 다른 도구)을 사용하여 수행하는 방법을 볼 수 있습니다. 손실 함수를 최소화하거나 사후 분포를 얻는다는 것은 저녁 식사를 위해 무엇을 먹고 싶은지 물었을 때 "음식"이라고 대답하는 것만큼이나 유용합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.