NY Times 의이 기사 " Odds, 지속적으로 업데이트"가 제 관심을 끌었습니다. 간단히 말해서, 그것은
[Bayesian statistics]는 2013 년 해안 경비대가 누락 된 어부 John Aldridge를 찾기 위해 사용한 것과 같은 검색을 포함하여 복잡한 문제에 접근하는 데 특히 유용하다는 것을 증명하고 있습니다 (지금까지 말레이시아 항공 370 호를 찾지 못했습니다). ...... 베이지안 통계는 물리학에서 암 연구, 생태학, 심리학에 이르기까지 모든 것을 휩쓸고 있습니다 ...
이 기사에는 잦은주의 p- 값에 대한 비판도 있습니다.
p- 값이 5 % 미만인 경우 일반적으로 결과는 "통계적으로 유의 한"것으로 간주됩니다. 그러나이 전통에는 위험이 있다고 Columbia의 통계 교수 인 Andrew Gelman은 말했다. 과학자들은 항상 계산을 올바르게 수행했지만 그렇지 않은 경우에도 p- 값이 5 % 인 모든 것을 수용한다는 것은 20 개의 "통계 학적으로 중요한"결과 중 하나가 랜덤 노이즈에 불과하다는 것을 의미한다고 그는 주장했다.
위의 것 외에도 p- 값을 비판하는 가장 유명한 논문은 다음과 같습니다-Regina Nuzzo의 "과학적 방법 : 통계 오류" -재현성 문제와 같이 p- 값 접근 방식으로 제기 된 많은 과학적 문제가 논의되었습니다. p- 값 해킹 등
통계적 유효성의 '골드 표준'인 P 값은 많은 과학자들이 생각하는 것만 큼 신뢰할 수 없습니다. ...... 아마도 최악의 오류는 펜실베이니아 대학의 심리학자 유리 시몬 손 (Uri Simonsohn)과 그의 동료들이 P- 해킹이라는 용어를 대중화 한 일종의 자기기만 일 것이다. 또한 데이터 준설, 스누핑, 낚시, 중요도 추적 및 이중 침지라고도합니다. Simonsohn은 "P 해킹은 무의식적으로도 원하는 결과를 얻을 때까지 여러 가지를 시도하고 있습니다"라고 말합니다. ......“그 결과는 p- 해킹을 통해 얻은 것으로 보이며, 저자는 전체 p- 값이 .05 미만이되도록 조건 중 하나를 삭제했습니다.”그리고“그녀는 p- 해커입니다. 그녀는 데이터를 수집하는 동안 항상 데이터를 모니터링합니다.”
또 다른 것은 플롯 에 대한 의견과 함께 here 에서 다음과 같은 흥미로운 플롯입니다.
효과가 아무리 작더라도 p <.05의 임계 값을 초과하기 위해 데이터를 수집하는 데 항상 많은 노력을 기울일 수 있습니다. 연구하고있는 효과가 존재하지 않는 한 p- 값은 데이터 수집에 얼마나 많은 노력을 기울 였는지 측정합니다.
위의 모든 질문은 다음과 같습니다.
두 번째 블록 인용문에서 Andrew Gelman의 주장은 정확히 무엇을 의미합니까? 왜 그는 5 %의 p- 값을 "통계 학적으로 중요한 20 개의 결과 중 하나는 주목하지만 랜덤 노이즈"로 해석 했습니까? p- 값이 하나의 단일 연구에서 추론하는 데 사용되므로 확신이 없습니다. 그의 요점은 여러 테스트와 관련된 것 같습니다.
업데이트 : 이것에 대해 Andrew Gelman의 블로그를 확인하십시오 : 아니요, 말하지 않았습니다! (@Scortchi, @whuber의 크레딧).
- 보다 신뢰할 수있는 연구 결과로 이어질 수있는 통계 분석에 p- 값 사용에 대한 실질적인 지침이 있습니까?
일부 통계 옹호자로서 베이지안 모델링 프레임 워크가 추구하는 더 좋은 방법일까요? 특히 베이지안 접근 방식이 잘못된 문제를 해결하거나 데이터 문제를 조작 할 가능성이 더 높습니까? 이전은 베이지안 접근에 매우 주관적이기 때문에 나는 여기에서도 확신하지 못한다. 베이지안 접근 방식이 잦은주의 p- 값보다 우수하거나 적어도 특정 경우에 더 우수하다는 실용적이고 잘 알려진 연구가 있습니까?
업데이트 : 베이지안 접근 방식이 잦은주의 p- 값 접근 방식보다 신뢰할 수있는 경우가 있는지에 특히 관심이 있습니다. "신뢰할 수 있음"은 베이지안 접근 방식이 원하는 결과를 위해 데이터를 조작 할 가능성이 적다는 것을 의미합니다. 어떤 제안?
2015 년 6 월 9 일 업데이트
방금 뉴스를 보았고 토론을 위해 여기에 두는 것이 좋을 것이라고 생각했습니다.
논란의 여지가있는 통계 테스트는 적어도 하나의 저널에서 마침내 그 목적을 달성했습니다. 이달 초, 기본 및 응용 사회 심리학 (BASP)의 편집자들은 통계가 품질이 낮은 연구를 지원하는 데 너무 자주 사용 되었기 때문에 저널은 더 이상 P 값을 포함하는 논문을 출판하지 않을 것이라고 발표했습니다.
최근 논문과 함께 Nature의 "변덕 P 값은 재현 할 수없는 결과를 생성합니다"라는 P 값에 관한 것입니다.
2016 년 5 월 8 일 업데이트
3 월에 미국 통계 협회 (ASA)는 통계적 중요성과 p- 값에 대한 진술을 발표했다. "... ASA 선언은 '포스트 p <0.05 시대'에 대한 연구를 추진하기위한 것이다."
이 진술에는 p- 값의 오용을 다루는 6 가지 원칙이 포함되어 있습니다.
- P- 값은 데이터가 지정된 통계 모델과 얼마나 호환되지 않는지를 나타낼 수 있습니다.
- P- 값은 연구 된 가설이 참일 확률 또는 무작위 확률만으로 데이터가 생성 될 확률을 측정하지 않습니다.
- 과학적 결론과 비즈니스 또는 정책 결정은 p- 값이 특정 임계 값을 통과하는지 여부에만 근거해서는 안됩니다.
- 적절한 추론은 완전한보고와 투명성을 요구합니다.
- p- 값 또는 통계적 유의성은 효과의 크기 나 결과의 중요성을 측정하지 않습니다.
- p- 값 자체만으로는 모형 또는 가설에 대한 증거를 제대로 측정 할 수 없습니다.
세부 사항 : "p- 값에 대한 ASA의 진술 : 문맥, 프로세스 및 목적" .