마우스를 아무 곳에 나 올려 놓으세요 꼬리표 (←아래에 표시되어 위키의 간략한 발췌 내용을 볼 수 있습니다. 줄 간격의 중단을 용서하십시오. 태그 발췌는 독자가 읽는 동안 전문 용어에 대한 이해를 확인하는 데 도움이 될 수 있기 때문에 가치가 있다고 생각합니다. 이 발췌 부분 중 일부는 편집 할 가치가 있으므로 홍보 인 IMHO도 필요합니다.
p > .05 일반적으로 거부하지 않아야 함을 암시 귀무 가설. 거꾸로,제 1 종 오류또는 다음 으로 인해 널을 거부 할 때 오 탐지가 발생합니다.견본 추출 오류 또는 기타 비정상적인 사고로 인해 견본 그렇지 않으면 (보통 p < .05)에서 무작위로 샘플링 한 인구여기서 널이 참입니다. 결과p > .05 그것은 거짓 긍정이라고 불립니다 귀무 가설에 대한 오해를 반영하는 것 같습니다 유의성 검정ING (NHST). NHST는 반 직관적으로 악명 높기 때문에 출판 된 연구 문헌에서 오해가 드물지 않습니다. 이것은의 집회 울음 중 하나입니다베이지안침략 (나는 지원하지만 아직 따르지 않음). 나는 최근까지도 이와 같은 잘못된 인상을 가지고 일해 왔으므로 가장 진심으로 동정합니다.
@DavidRobinson은 다음을 관찰하는 것이 정확합니다. 피 널이 거짓 일 확률이 아니다 빈번한NHST. 이것은 적어도 Goodman (2008) "Dirty Dozen"의 오해 중 하나입니다.피가치 ( Hurlbert & Lombardi, 2009 참조 ) . NHST에서피 입니다 개연성 관계 또는 차이를 나타내는 동일한 방법으로 미래의 임의 샘플을 추출 할 것입니다. 효과 크기 다른 효과 크기의 다른 종류가 존재하는 경우 null에 대해 테스트되고 있습니까? ...) 동일한 모집단의 샘플이 주어진 결과에 도달하기 위해 최소한 null 귀무 가설과 다른 경우 피널이 참인 경우 값 . 그건,피null이 주어진 샘플과 같은 샘플을 얻을 확률입니다 . 그것은 적어도 직접적으로는 아니고 널 (null)의 확률을 반영하지 않습니다. 반대로 베이지안 방법은 통계적 분석의 공식화에 대해 또는이전그들이 주장 하는 데이터 에 대한 효과 이론은 다른 장점들 중에서도 보다 직관적으로 호소력있는 접근법 이며 ( Wagenmakers, 2007 ) 논쟁의 여지가있는 단점을 제외하고있다. (공평하게, " 베이지안 분석의 단점은 무엇입니까? "를 참조하십시오. 또한 Moyé, 2008; Hurlbert & Lombardi, 2009에서 멋진 답변을 제공 할 수있는 기사를 인용하는 것에 대해서도 언급했습니다 .)
논란의 여지가 있지만, 귀무 가설은 가장 일반적으로 말 그대로 영 효과 의 가설이기 때문에 말 그대로 언급 된 귀무 가설은 종종 틀리지 않을 가능성이 높습니다 . (일부 편리한 반례의 경우, " 대규모 데이터 세트가 가설 검정에 부적합한가? "에 대한 답변을 참조하십시오. ) 나비 효과 와 같은 철학적 문제 는 문자 그대로를 위협합니다타당성그러한 가설의 따라서 널은 0이 아닌 일부 효과의 대체 가설에 대한 비교의 기초로 가장 일반적으로 유용합니다. 이러한 대안 적 가설은 데이터가 수집 된 후 null이 true 인 경우 불가능 했을 null보다 더 타당한 것으로 남아있을 수 있습니다 . 따라서 연구자들은 일반적으로 귀무에 대한 증거로부터 대체 가설에 대한 지원을 유추하지만, 그렇지 않습니다.p- 값직접 정량화 ( Wagenmakers, 2007 ) .
당신이 의심하는 것처럼 통계 학적으로 유의 의 기능이다 표본의 크기효과 크기와 일관성뿐만 아니라 (참조는 @ 최근의 질문에 궁의 대답은, " 평균 차이가 거의 0 인 경우 어떻게 t-test를 통계 학적으로 유의 할 수 있는가? ") 우리는 종종 우리의 데이터를 요청하고자하는 질문은 효과 무엇 "이다 x에가 y? " 다양한 이유로 (특히 통계가 아닌 사람들이 가르치는 통계에서 IMO, 오해의 여지가 있거나 부족한 교육 프로그램을 포함하여), 우리는 종종 느슨하게 관련된 질문을 묻습니다. 에 x영향을 미치지 않는 인구에서 y? " 이것이 각각 효과 크기 추정과 유의성 테스트의 필수 차이입니다. ㅏ피 가치는 후자의 질문에만 직접적으로 대답하지만 여러 전문가 (@rpierce는 아마도 나보다 더 나은 목록을 제공 할 수 있습니다. 피효과 크기에 대한 이전 질문에 대한 답변으로 너무 자주; 동의해야합니다.
의 의미에 대해 더 직접적으로 대응하기 위해 .05 < p < .95, 이는 null이 참인 모집단에서 무작위로 데이터를 샘플링 할 확률이지만, 데이터만큼이나 널이 최소한 넓고 일관된 여백에 의해 문자 적으로 설명하는 것과는 다른 관계 또는 차이를 나타냅니다. .. <흡입>은 5–95 % 사이입니다. 샘플 크기를 늘리면 작고 일치하지 않는 효과 크기를 감지하고 5 %를 초과하는 신뢰도를 가진 영 (zero) 효과와 차별화하는 능력을 향상시키기 때문에 이것이 샘플 크기의 결과라고 확신 할 수 있습니다. 그러나 작고 일관되지 않은 효과 크기는 실용적 으로 중요 하지 않을 수도 있습니다 (≠통계적으로 유의미 함 – Goodman (2008)의 또 다른 수십 가지); 이는 데이터의 의미에 훨씬 더 의존하며, 통계적 유의성은 제한된 범위에만 해당됩니다. 위의 내 답변을 참조하십시오 .
... p> 0.95 인 경우 결과를 확실히 지원하지 않고 거짓으로 호출하는 것이 정확하지 않습니까?
데이터 는 일반적으로 경험적으로 사실적인 관찰을 나타내므로 거짓이 아니어야합니다. 그들에 대한 추론 만이 이상적으로이 위험에 직면해야합니다. (측정 오류는 물론 발생하지만 해당 문제는이 답변의 범위를 벗어났습니다. 여기서 언급하지 않고 따로 남겨 두겠습니다.) 항상 null이 덜 유용하다는 잘못된 긍정 추론을 만드는 위험이 있습니다. 적어도 추론자가 널이 참이라는 것을 알지 않는 한, 대체 가설보다. 생각하기 어려운 지식의 상황에서만 널이 문자 적으로 사실이라는 것만으로, 적어도 지금 당장 상상할 수있는 한, 대체 가설을 선호하는 추론은 반드시 거짓 일 것 입니다.
분명히 널리 사용되거나 관습은 유행이나 추론의 유효성에 대한 최고의 권한이 아닙니다. 출판 된 자원조차도 오류가 있습니다. 예를 들어 p- 값 정의의 오류를 참조하십시오 . 참고 문헌 ( Hurlbert & Lombardi, 2009 ) 에서도이 원칙에 대한 흥미로운 설명을 제공합니다 (322 페이지).
StatSoft (2007)는 웹 사이트 에서 온라인 설명서가 "백과 사전 브리타니 카 (Encyclopedia Brittanica)가 권장하는 통계에 대한 유일한 인터넷 리소스"라는 것을 자랑합니다 . " 범퍼 스티커에서 알 수 있듯이 'Distrust Authority'가 그렇게 중요하지 않았습니다. [만화가 깨진 URL이 하이퍼 링크 텍스트로 변환되었습니다.]
또 다른 사례가있다 : 가장 최근의 Nature News 기사 ( Nuzzo, 2014 ) 에서이 문구는 : "P 가치, 증거의 강도에 대한 공통 지수 ..." Wagenmakers (2007, 페이지 787) "문제 3 :피가치는 통계적 증거를 정량화하지 않는다 "... 그러나 @MichaelLew ( Lew, 2013 ) 는 유용하다고 생각하는 방식에 동의하지 않습니다.피우도 함수를 색인하기위한 값. 그러나이 출판 된 자료들이 서로 모순되는 한 최소한 하나는 틀려 야합니다! (어떤 수준에서, 나는 생각한다 ...) 물론 이것은 "신뢰할 수없는"그 자체만큼 나쁘지 않다. 나는 내가 가진 것처럼 태그를 지정하여 Michael을 여기에 속일 수 있기를 바랍니다 (그러나 사용자 태그를 편집 할 때 알림을 보낼지는 확실하지 않습니다. OP에서 귀하의 것으로 생각하지 않습니다). 그는 Nuzzo를 구할 수있는 유일한 사람 일 수 있습니다 – 심지어 자연 그 자체! 오비완 도와주세요! (여기서 나의 대답이 여전히 당신의 작업의 의미를 이해하지 못했다는 것을 용서하십시오. 어쨌든 확실합니다 ...) BTW, Nuzzo는 또한 흥미로운 자기 방어와 반박을 제공합니다. Wagenmaakers의 "문제 3": Nuzzo의 "가능한 원인"참조( Goodman, 2001 , 1992; Gorroochurn, Hodge, Heiman, Durner, & Greenberg, 2007 ) . 이것들은 당신이 정말로 찾고있는 대답을 포함 할 수도 있지만, 내가 말할 수는 없을 것입니다.
다시 : 당신의 객관식 질문, 나는 선택 d합니다. 여기에 몇 가지 개념을 잘못 해석했을 수도 있지만, 그렇지 않은 경우에는 반드시 혼자가 아니며, 당신이 정말로 믿는 것을 아는 것만으로 판단을 내릴 것입니다. 오해는 어느 정도의 확실성을 암시하지만, 질문하는 것은 반대를 의미하며, 불확실 할 때 의문의 충동은 상당히 칭찬받을 수 있고 유비쿼터스와는 거리가 멀다. 인간의 본성에 관한 문제는 우리의 협약의 부정확성을 슬프게도 무해하게 만들지 않으며 여기에 언급 된 불만과 같은 불평을받을 가치가 있습니다. (일부 감사합니다!) 그러나 귀하의 제안도 완전히 정확하지는 않습니다.
관련된 문제에 대한 흥미로운 토론 피내가 참여한 값은이 질문에 나타납니다 : p- 값의 확고한 견해 수용 . 내 답변에는 해석상의 문제와 대안에 대한 추가 정보를 읽는 데 유용한 몇 가지 참고 문헌이 나와 있습니다.피가치. 미리 경고하십시오 : 나는 여전히이 특정 토끼 구멍 의 바닥에 부딪치지 않았지만 적어도 그것이 매우 깊다는 것을 말할 수 있습니다 . : 나는 아직도 그것에 대해 자신을 (! 또는 어쩌면 NFSA 관점 다른 내가 더 베이지안 관점 [편집]에서 작성 될 거라고 생각 배우고 Hurlbert & 롬바르디, 2009 ) , I는 최상의 약한 권한이다, 나는 환영 다른 사람들이 내가 말한 내용에 대해 정정하거나 정교하게 제공 할 수 있습니다. 내가 결론을 내릴 수있는 것은 아마도 수학적으로 정답 일 수 있다는 것입니다. 대부분의 사람들이 잘못 생각할 수도 있습니다. 다음 참고 문헌에서 알 수 있듯이 정답은 확실히 쉽지 않습니다 ...
추신 : 요청에 따라 (일종의 ... 나는 실제로 작업하는 대신 이것을 시도하고 있음을 인정합니다),이 질문은 때때로 균일 한 분포에 대한 더 나은 참조 입니다피" n- 가설 하에서 p- 값이 균일하게 분포되는 이유는 무엇입니까? "특히 @whuber의 의견은 예외 클래스를 발생시킵니다. 전체적으로 논의가 어느 정도 사실이므로, 나는 그 의미를 포함하여 100 % 논증을 따르지 않기 때문에 이러한 문제가 확실하지 않습니다.피분포 균일 성은 실제로 예외적입니다. 심오한 통계적 혼란의 추가 원인, 나는 두렵다.
참고 문헌
-Goodman, SN (1992). 복제, P- 값 및 증거 에 대한 의견 . 의학 통계, 11 (7), 875-879.
-Goodman, SN (2001). 의 P의 겸손한 제안 : -values와 베이 즈. 역학, 12 (3), 295–297. http://swfsc.noaa.gov/uploadedFiles/Divisions/PRD/Programs/ETP_Cetacean_Assessment/Of_P_Values_and_Bayes__A_Modest_Proposal.6.pdf 에서 검색했습니다 .
-Goodman, S. (2008). 더러운 12 가지 : 12 가지 P- 값 오해. 혈액학 세미나, 45 (3), 135–140. http://xa.yimg.com/kq/groups/18751725/636586767/name/twelve+P+value+misconceptions.pdf 에서 검색했습니다 .
-Gorroochurn, P., Hodge, SE, Heiman, GA, Durner, M., & Greenberg, DA (2007). 연관 연구의 비 복제 : 복제하는 "의사-실패"? 의학 유전학, 9 (6), 325–331. http://www.nature.com/gim/journal/v9/n6/full/gim200755a.html 에서 검색했습니다 .
-Hurlbert, SH, & Lombardi, CM (2009). Neyman-Pearson 의사 결정 이론 프레임 워크의 최종 붕괴와 신 피셔 인의 등장. Annales Zoologici Fennici, 46 (5), 311–349. http://xa.yimg.com/kq/groups/1542294/508917937/name/HurlbertLombardi2009AZF.pdf 에서 검색했습니다 .
-Lew, MJ (2013). P로 또는 P로 : P- 값의 증거 적 성격과 과학적 추론에서의 위치. arXiv : 1311.0081 [stat.ME]. 에서 검색http://arxiv.org/abs/1311.0081 .
-LA, Moyé (2008). 임상 시험의 베이지안 : 스위치에서 자고 있습니다. 의학 통계, 27 (4), 469–482.
-R. Nuzzo (2014 년 2 월 12 일). 과학적 방법 : 통계 오류. Nature News, 506 (7487). http://www.nature.com/news/scientific-method-statistical-errors-1.14700 에서 검색했습니다 .
-EJ Wagenmakers (2007). p 값 의 광범위한 문제에 대한 실질적인 해결책 . 심리학 적 게시판 및 검토, 14 (5), 779–804. http://www.brainlife.org/reprint/2007/Wagenmakers_EJ071000.pdf 에서 검색했습니다 .