이 경우에 그들의 주장에 대한 정당성이 거의 없으며, 그들이 이미 가지고있는 결론에 도달하기 위해 통계를 남용하는 것 같습니다. 그러나 p-val 컷오프에 너무 엄격하지 않은 경우가 있습니다. 통계적 의미와 pval 컷오프를 사용하는 방법은 Fisher, Neyman 및 Pearson이 처음 통계 테스트의 기초를 마련한 이후로 논쟁의 여지가있는 논쟁입니다.
모델을 작성 중이고 포함 할 변수를 결정한다고 가정 해 봅시다. 잠재적 변수에 대한 예비 조사를 수행하기 위해 약간의 데이터를 수집합니다. 이제 비즈니스 팀이 실제로 관심을 갖는이 변수가 있지만 예비 조사에 따르면 변수가 통계적으로 유의하지 않다는 것이 밝혀졌습니다. 그러나 변수의 '방향'은 비즈니스 팀이 예상 한 것과 일치하며, 중요성의 임계 값을 충족 시키지는 않았지만 근접했습니다. 아마도 결과와 긍정적 인 상관 관계가있는 것으로 의심되었으며 베타 계수는 긍정적이지만 pval은 0.05 컷오프보다 약간 높았습니다.
이 경우 계속해서 포함시킬 수 있습니다. 그것은 일종의 비공식적 인 베이지안 통계입니다. 유용한 변수라는 강력한 사전 믿음이 있었고 초기 조사에서 그 방향으로 증거가 있었지만 (통계적으로 유의미한 증거는 아닙니다!) 모델에 보관하십시오. 더 많은 데이터가있을 경우 관심있는 결과와의 관계가 더 분명 할 것입니다.
또 다른 예는 새 모델을 작성하고 이전 모델에서 사용 된 변수를 살펴볼 수 있습니다. 한계 변수 (중요도에있는 변수)를 계속 포함하여 모델의 연속성을 유지할 수 있습니다. 모델링합니다.
기본적으로, 당신이하는 일에 따라 이러한 종류의 것들에 대해 점점 엄격 해야하는 이유가 있습니다.
다른 한편으로, 통계적 유의성이 실제적 의의를 암시 할 필요는 없다는 것을 명심해야합니다! 이 모든 것의 핵심은 샘플 크기라는 것을 기억하십시오. 충분한 데이터를 수집하면 추정치의 표준 오차가 0으로 줄어 듭니다.이 차이가 실제 세계에 해당되지 않더라도 '통계적으로 유의미한'아무리 작더라도 상관없이 모든 종류의 차이가 발생합니다. 예를 들어, 특정 코인이 헤드에 상륙 할 확률이 .500000000000001이라고 가정합니다. 이것은 이론적으로 동전이 공평하지 않다는 결론을내는 실험을 설계 할 수 있다는 것을 의미하지만, 모든 의도와 목적을 위해 동전을 공정 동전으로 취급 할 수 있습니다.