이것이 p- 값 문제에 대한 해결책입니까?


67

2016 년 2 월 미국 통계 협회 (American Statistical Association)는 통계적 중요성과 p- 값에 대한 공식적인 진술을 발표했습니다. 이에 대한 우리의 스레드는 이러한 문제를 광범위하게 설명합니다. 그러나 현재까지 보편적으로 인정되는 효과적인 대안을 제시 할 권한은 없습니다. ASS (American Statistical Society)는 이에 대한 p- 값을 발표했습니다 . 다음은 무엇입니까?

"p- 값은별로 좋지 않습니다."

우리는 ASA가 충분히 멀리 가지 않았다고 생각합니다. p- 값의 시대가 끝났다는 것을 인정할 때입니다. 통계 학자들은 이들을 성공적으로 사용해 학부생, 속임수 과학자 및 바보 편집자를 사방에 몰아 넣었지만 세계는이 소문을 통해보기 시작했습니다. 우리는 20 세기 초 통계 학자들이 의사 결정을 통제하려는 시도를 포기해야합니다. 우리는 실제로 작동 하는 것으로 돌아와야 합니다.

공식 ASS 제안은 다음과 같습니다.

p- 값 대신 ASS는 STOP (SeaT-Of-Pants 프로 시저)을 옹호합니다 . 이 오랜 명성과 검증 된 방법은 로날드 피셔가 와서 물건을 망칠 때까지 고대 그리스인, 르네상스 남성 및 모든 과학자들에 의해 사용되었습니다. STOP은 단순하고 직접적이며 데이터 중심적이며 신뢰할 수 있습니다. 그것을 수행하기 위해 권위자 수치 (선호 적으로 나이 많은 남성)가 데이터를 검토하고 그들이 자신의 의견에 동의하는지 여부를 결정합니다. 그가 결정하면 그 결과는 "유의합니다". 그렇지 않으면 모든 것이 잊혀지지 않아야합니다.

원칙

이 답변은 ASA의 6 가지 원칙 각각을 다룹니다.

  1. STOP은 데이터가 지정된 통계 모델과 얼마나 호환되지 않는지를 나타낼 수 있습니다.

    우리는이 문구를 좋아합니다. STOP이 예 또는 아니오라는 질문에 대답 할 수있는 멋진 방법이기 때문입니다. p- 값이나 다른 통계 절차와 달리 의심 할 여지가 없습니다. “우리는 stinkin '귀무 가설이 필요 없다고 말하는 사람들에게 완벽한 반응입니다! 어쨌든 *?! @는 무엇입니까? 아무도 그것이 무엇인지 예상 할 수 없었습니다.”

  2. STOP은 가설이 참일 확률을 측정하지 않습니다. 실제로 참인지 여부를 결정합니다.

    모든 사람들은 확률로 혼란스러워합니다. STOP은 그림에서 가능성을 빼앗아 수년간의 학부 및 대학원 연구가 필요하지 않습니다. 이제는 (나이가 많고 남성 인) 누구나 단일 통계 강의를 듣거나 이해할 수없는 결과를 내뿜는 비전 소프트웨어를 실행하는 고통과 고문없이 통계 분석을 수행 할 수 있습니다.

  3. 과학적 결론과 비즈니스 또는 정책 결정은 상식과 실제 권한 수치를 기반으로 할 수 있습니다.

    어쨌든 당국은 항상 중요한 결정을 내렸으므로이를 인정하고 중개인을 잘라내 자. STOP을 사용하면 통계학자가 숫자를 사용하여 진실을 난독 화하고 권력을 가진 사람들의 선호를 성화시킬 수 있습니다.

  4. 적절한 추론은 완전한보고와 투명성을 요구합니다.

    STOP은 지금까지 발명 된 가장 투명하고 자명 한 통계 절차입니다. 데이터를보고 결정합니다. 사람들이 데이터의 의미를 전혀 모르는 사실을 숨기기 위해 사용하는 혼란스러운 z- 테스트, t- 테스트, 카이 제곱 테스트 및 알파벳 수프 절차 (ANOVA! GLM! MLE!)를 제거합니다.

  5. STOP은 결과의 중요성을 측정합니다.

    이것은 자명합니다. 권한을 가진 사람이 STOP을 사용하는 경우 결과는 중요해야합니다.

  6. STOP 자체만으로 모델 또는 가설에 관한 훌륭한 증거를 제공합니다.

    우리는 권위에 도전하고 싶지 않을까요? 연구원과 의사 결정자는 STOP이 알아야 할 모든 정보를 제공한다는 것을 인식 할 것입니다. 이러한 이유로 데이터 분석은 STOP으로 끝날 수 있습니다. p- 값, 머신 러닝 또는 점성술과 같은 대체 방법이 필요하지 않습니다.

다른 접근법

일부 통계 학자들은 소위“바이에 시안 (Bayesian)”방법을 선호하는데,이 방법은 18 세기 성직자에 의해 사후에 출판 된 모호한 정리가 모든 문제를 해결하기 위해 무의식적으로 적용된다. 가장 널리 알려진 옹호자들은이 방법들이“주관적”이라는 점을 자유롭게 인정합니다. 우리가 주관적인 방법을 사용하려고한다면, 결정권자가 더 권위 있고 지식이 많을수록 결과는 더 나아질 것입니다. 따라서 STOP은 모든 Bayes 방법의 논리적 한계로 나타납니다. 담당자에게 데이터를 보여주고 자신의 의견이 무엇인지 물어볼 때 왜 끔찍한 계산을하고 컴퓨터 시간을 많이 묶는 노력을 기울여야합니까? 이야기의 끝.

통계학 자의 신권에 도전하기 위해 최근에 다른 공동체가 생겨났다. 그들은 스스로를“기계 학습자”와“데이터 과학자”라고 부르지 만 실제로는 더 높은 지위를 찾는 해커 일뿐입니다. ASS의 공식 입장은 사람들이 사람들을 진지하게 받아들이 길 원한다면 자신의 전문 조직을 형성해야한다는 것입니다.


질문

이것이 ASA가 p- 값과 귀무 가설 검정으로 식별 한 문제에 대한 답입니까? 실제로 베이지안과 빈번한 패러다임을 통합 할 수 있는가?


11
"최고의 STOP ASS 판사를위한 도널드 트럼프 : 통계를 다시 훌륭하게 만드십시오!"
Alex R.

14
분명히 STOP은 차선책입니다. 이것이 ASS와 같은 존경받는 학자 조직을 탈출 한 것에 놀랐습니다. 재치, 왜 데이터 보는 데 시간이 낭비 됩니까? 예 / 아니오로 답하십시오. 이 방법론은 현재 큰 효과를 위해 사용되고 있습니다. 특히 4 년으로 나눌 수있는 미국의 사례 연구가 많이 있습니다.
추기경

4
더 이상 사람들이 데이터를 분석하기 위해 고용하는 데 드는 막대한 비용을 부담 할 필요가 없기 때문에 기업은 이러한 방법을 채택함으로써 엄청난 혜택을 얻을 수 있다고 생각합니다.
dsaxton

4
@henry [april-1] 태그가 알려주지 않은 것처럼?
Glen_b

9
@ 헨리 진심으로? 당신은 우리에게 보여줄 수 있는 당신의 이름을 구글로 분기 만 히트를 통해 얻을 수 가짜 조직을?
whuber

답변:


18

나는 RADD : R oll A D amn D ie 라고하는 통계적 의사 결정에 대한 나의 새로운 접근법을지지 해왔다 . 또한 모든 핵심 사항을 다룹니다.

1) RADD는 데이터가 지정된 통계 모델과 얼마나 호환되는지 나타낼 수 있습니다.

더 높은 숫자를 굴릴 경우, 분명한 증거가 모델에 더 유리합니다! 또 다른 이점은 더 많은 자신감을 원한다면 더 많은면으로 주사위를 굴릴 수 있다는 것입니다. 충분히 검색하면 100면 주사위를 찾을 수 있습니다!

2) RADD는 가설이 참인지 아닌지를 결정할 수 있습니다.

양면 주사위, 즉 동전 뒤집기 만하면됩니다.

3) RADD는 비즈니스 또는 정책 결정에 사용될 수 있습니다

한 방에 여러 정책 입안자를 가져 와서 모두 주사위를 굴리십시오! 최고의 승리!

4) RADD는 투명합니다.

결과를 기록하고 추가 연구를 위해 다이 자체를 유지할 수 있습니다 *

5) RADD는 결과의 중요성을 측정합니다.

분명히 높은 롤링은 매우 중요한 이벤트가 발생했음을 나타냅니다.

6) RADD는 좋은 증거를 제공합니다.

롤이 높을수록 좋다고 말하지 않았습니까?

따라서 아닙니다. STOP은 답이 아닙니다. 답은 RADD입니다.


7
잊지 말고, 예를 들어 100면 주사위를 가장 많이 획득 한 5면 중 하나가 달성 될 때 귀무 가설을 기각함으로써 유형 I 오류 제어 (충분한면이 지정된 임의의 수준에서)를 보장 할 수 있습니다. 5 % 유형 I 오류율.
Björn

1
멋진 플라톤 다면체와 멋진 비 플라톤 다면체 를 언급하는 것을 잊었습니다 .
Alexis

17

나는 비즈니스 경험에서 STOP이 기본 의사 결정 기준이며 보다 선호한다고 말합니다.p-값 및 기타 빈번한 또는 베이지안 방법. 비즈니스 관점에서 STOP은 불확실한 "probabilistic"방법보다 더 신뢰할 수있는 간단하고 확실한 답변을 제공합니다. 또한 대다수의 경우 다른 방법보다 구현이 간단하고 현실에 적응하기가 더 쉽습니다. 예 / 아니오 결정은 중간 및 고위 경영진에게 더 설득력이 있습니다. 대부분의 경우 "STOP 보고서"는 데이터 기반 보고서보다 짧고 읽기 쉽습니다. 또한이 방법을 채택하면 고용주는 데이터 과학자 및 SAS 라이센스 비용을 줄일 수 있습니다. STOP의 유일한 문제는 STOP 결과를 나타내는 PowerPoint 프레젠테이션을 만드는 것이 더 어렵다는 것입니다. 그러나 이것은 역동적으로 발전하는 분야이므로 앞으로 더 나은 시각화 방법이 제안 될 수 있습니다.


6
결론이 포함 된 PowerPoint 슬라이드가 요약되면 변경하기에 너무 늦었으므로 두 가지 선택 사항이 있거나, 결론에 맞게 분석을 수행하거나, 분석을 전혀 방해하지 않습니다.
Mark L. Stone

12
@ MarkL.Stone 물론! 나는 개인적으로 데이터를보기 전에 프리젠 테이션을위한 계획을 세우는 아이디어를 좋아한다. 그 아이디어는 베이지안 사고에 뿌리를두고 있으며 그것들을 선험적 인 플롯이라고 부른다. 2008-05-08

15

p- 값 토론에 대한이 훌륭한 보조는 흥미롭지 만 제 생각에는 다소 부실합니다. 몇 년 전 영국 의학 저널 (BMJ) 의 크리스마스 호에 실린 독창적 인 논문이 떠 올랐습니다. 조항. 특히, Isaacs와 Fitzgerald 의이 연구는 증거 기반의 의학에 대한 7 가지 주요 대안을 강조했습니다 (즉, 실제 임상 및 통계적 증거에 근거한 의약품의 실천).

  • 저명 기반 의학
  • Vehemence 기반 의학
  • Eloquence 기반 의학
  • 섭리 기반 의학
  • 난이도 기반 의학
  • 신경계 약
  • 자신감 기반 의학

가장 흥미롭게도, 위 항목에 대한 측정 장치 및 측정 단위를 강조 표시하는 열을 확인해야합니다 (예 : vehemence based medicine의 경우 오디오 미터 및 데시벨!).


4
+1. 질문의 정신에 완벽히 기여한 훌륭한 기여에 감사드립니다. (1) 명확히하기 위해 : 당신이 "이야기"또는이 질문을 찾는 p- 값 논쟁입니까? (2) "J 지수 급여"를 참조 할 위치를 알고 있습니까? 나는 그것이 더 잘 알려져 있다면 많은 열렬한 독자를 가질 것이라고 확신합니다.
whuber

5
(1) 귀하의 기여는 '신선하게 인증'되었습니다 (rottentomatoes.com을 인용). 반대로, 나는 p 값의 한계에 대해이 강조를 다소 부실하게 생각합니다. 기계 학습, 빅 데이터 및 대중의 과학적 문맹 퇴치 시대에 ASA 입장은 약간의 마조히스트처럼 보일 수 있습니다. (2) 나는 당신이 다른 BMJ 성탄절 추천 글 bmj.com/content/327/7429/1459 에서 추천 한 무작위 시험을 출판 한 같은 저널에서 그 기사를 찾을 것이라고 생각합니다 .
Joe_74

Dunning-Kruger 기반 추론을 사용하는 것이 신뢰 기반 의학입니까?
Alexis
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.