"Null 가설 통계 검정"과 다른 검정의 차이점은 무엇입니까?


9

최근 화제가되고있는 주제는 저널에 제출 된 논문에서 "Null 가설 통계 테스트 절차 (NHSTP)"의 사용을 금지하는 저널에 관한 것입니다. 나는이 용어가 몇몇 작가들에 의해 사용 된 것을 보았지만, 그들이 어떤 구별을하려고하는지 이해하지 못한다. NHSTP가 "가설 검정"또는 "유의 검정"과 다른 점이 있습니까?


1
다소 더 자주 사용되는 약어는 NHST입니다 (끝에 P가 없음). 두 약어는 싫어하는 작가들이 사용하는 중용 어처럼 보인다 (이런 논쟁의 맥락에서). NHST + null (1670 개 결과, NHSTP + null은 145 개만 해당)에 대한 Google 학술 검색 에서 한눈에 확인할 수 있습니다 . 문제와 관련된 문제입니다. 또 다른 관련 용어는 "무의식"입니다. 그 모든 것은 당신이 생각하는 것을 의미하지만, 혐오감으로 발음됩니다!
amoeba

2
동등성 테스트 와 같이 일반적인 NHST와는 개념적으로 상당히 다른 테스트가 있습니다. 비록 기계적으로 (그러나 놀랍지 않게도) 밀접하게 관련된 프레임 워크를 사용합니다. 그러나, 해당 저널의 편집인도 아마 이것에 대해 논쟁 할 것이라고 생각합니다.
Glen_b-복지 모니카

1
관련성 (중복은 아님) : “가설 검증”과“중요 검증”의 차이점은 무엇입니까? 또한,이 저널의 편집자들은 분명히 그 둘을 구별하려고 하지 않습니다 ! Fisher, Neyman-Pearson 또는 하이브리드 등 모든 종류의 가설 / 의미 / 모든 테스트를 금지합니다. 피셔 대 네이 먼-피어슨 (vs. 하이브리드) 대 전쟁의 맥락에서만 구별이 이루어 지는데, 이는이 특정 저널의 금지에 관한 것이 아닙니다.
amoeba

1
@Livid, "NHST"는 Fisher와 NP 패러다임과는 달리 통계 테스트가 실제로 사용되는 방식을 나타냅니다. 나는 그것이 크랭크의 일상적이고 생각없는 선회를 의미한다면, 그것이 중대한 용어라는 데 동의 할 것입니다.
Russ Lenth

1
@rvl 여기에 제가 생각했던 논문 (+ 논평)이 있습니다 : 통계적 중요성의
Livid

답변:


1

배경 : 문제의 사설이 있습니다 하나 에서 기본 및 응용 사회 심리학 , 즉 1.168의 2015 영향 인자 저널, 매우 인용 할 수 없습니다.

Re : OP question , 즉 NHSTP가 "가설 검정"또는 "유의 검정"과 다른 점이 있습니까? 적용 가능한 편집 진술은

1) "...the null hypothesis significance testing procedure (NHSTP)  is invalid..." [Sic, with alpha = 0.05]
2) "...authors will have to remove all vestiges of the NHSTP (p-values, t-values, F-values, statements about ‘‘significant’’ differences or lack thereof, and so on)."
3) "...confidence intervals [Sic, 95%] also are banned from BASP."
4) "...Bayesian procedures are neither required nor banned from BASP." [Sic, depends on which ones, they are either banned or not.]
5) "Are any inferential statistical procedures required?...No..."

이를 위해 제공되는 동기는 "...<.05바는 통과하기 너무 쉽고 때로는 품질이 낮은 연구에 대한 변명으로 사용됩니다. 우리는 NHSTP 금지가 NHSTP 사고의 체계화 된 구조에서 저자들을 해방 시켜서 창의적 사고에 대한 중요한 장애물을 제거함으로써 제출 된 원고의 품질을 높이는 효과가 있기를 희망합니다. "

OP에 대한 답변 : 이 편집자들은 아마도 유의성 검정이 종종 가설에 대한 부적절한 검정이라고 주장 할 것입니다. 예를 들어, 그들은 "... 라플라시안의 가정 을 적어도 어느 정도 우회하는 베이 시안의 제안 [Sic, 나는 선험을 알지 못한다 ] ... [그런 점] 이것은 실제로 거기에있다 ... "이것은 부분적 으로 @Livid에 의해 지적되고 편집부가 Fisher와 함께 할 Fisher 대 Neyman과 Pearson의 주장 과 관련이있다.

토론 : 저는 기본적이고 필수 불가결 한 과학적 방법으로 지적 겸손을 굳게 믿습니다. 만약 연구자로서, 모든 이전 이론이 불신하는 가정없는 초기 전제에서 진행할 수 없다면, 창의적이고 열린 마음으로 데이터를 조사 할 수있는 모든 능력을 잃게 될 것입니다. 모든 수치 처리가 절대적인 진실이어야한다는 전제는 숭고한 큐피드의 표현입니다. 유일한 진실은 데이터이고, 나는 겸손하게 의역 것이다 상자모든 모델, 특히 가장 확실하게 데이터 자체와 동일하지 않은 모든 것에서 진실이 발생한다고 가정하는 모델은 모두 거짓이라고 진술함으로써 그것은 내가 피셔와 네이 먼 / 피어슨 사이에서 선택해야한다는 것을 의미하는 것이 아니라, 전제를 취하지 않고 내 가설이지지되고 /되거나 앙상블의 자기 일관성을 거부 할 때까지 철저하게 사물을 조사한다는 것을 의미합니다. 어떤 분석도 절대 진실을 밝힐 수 없기 때문에 자기 일관성 만 기준으로 사용할 수 있습니다.

내가하는 일이 모든 사람을위한 것은 아닙니다. 많은 사람들이 'top down'이라고 부르는 엄격한 통제 된 실험 설계에서 테스트 계획을 선호합니다. 그러나 제어 된 실험은 데이터 마이닝, 패턴 인식 및 가설 생성에 비효율적입니다. 좁은 질문을 테스트하는 데 유용하며 NHSTP에 대한 논쟁이 발생할 수 있습니다. 증거를지지하지 않으면 서, 예를 들어, 의존성에 대한 전체적인 일관성의 구조는 어떤 비판에도 개방된다. 이것은 반대로 Bonferroni로 간주 될 수 있습니다. 여러 번의 테스트로 피할 수없는 일관된 앙상블이 발생하는 경우 우연히 발생하는 앙상블의 가능성이 줄어 듭니다. 심리학 실험 계획에서 사용하지 않는 것에 대한 넌센스<0.05 또한 특정 테스트 결과의 모든 영향을 테스트하지 않았기 때문에 0.05 실험 설계가 너무 튼튼하고 제한적이며 좁기 때문에 0.001. 그러나 특정 통계적 방법이 무의식적으로 사용되고 있고 무심한 작업이 검토 될 때 반드시 통과해야하기 때문에 특정 통계적 방법을 금지한다는 것은 단지 편집자가 검토에 동의하기 전에 저품질 작업을 식별하지 않고 자격있는 검토 자에게 접근하지 않음을 의미합니다. 확실히 하나의 상황 증거에 근거하여 합리적인 신념을 확립 할 수는 없습니다. 오히려 정황 증거의 앙상블은 합리적인 신념으로 이어집니다. 상황 이 불분명 하기 때문에 증거의 전체 범주를 제거해도 저널의 내용은 개선되지 않습니다.


"... 과학적 방법의 기본 및 필수 불가결 한 세입자로 ..."- 나는 당신에게 평균 기대 신조 보다는 세입자 .
Glen_b-복지 주 모니카

@Glen_b Je tiens à vous remercier . 나는 더 잘 알고 있었지만 어쨌든 모두 잘못되었을 것으로 예상합니다. Ergo , 나머지는, 어떤 생각?
Carl
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.