N이 약 200,000 인 데이터 세트로 작업하고 있습니다. 회귀에서, 매우 작은 효과 크기와 관련된 매우 작은 유의성 값 << 0.001, 예를 들어 r = 0.028을보고 있습니다. 내가 알고 싶은 것은 표본 크기와 관련하여 적절한 유의성 임계 값을 결정하는 원칙적인 방법이 있습니까? 이러한 큰 샘플로 효과 크기를 해석 할 때 고려해야 할 다른 중요한 사항이 있습니까?
N이 약 200,000 인 데이터 세트로 작업하고 있습니다. 회귀에서, 매우 작은 효과 크기와 관련된 매우 작은 유의성 값 << 0.001, 예를 들어 r = 0.028을보고 있습니다. 내가 알고 싶은 것은 표본 크기와 관련하여 적절한 유의성 임계 값을 결정하는 원칙적인 방법이 있습니까? 이러한 큰 샘플로 효과 크기를 해석 할 때 고려해야 할 다른 중요한 사항이 있습니까?
답변:
에서 의미 테스트의 무의미 , (1999) 존슨은, 충분한 데이터를 수집 귀무 가설을 가정하여 원하는대로 거의 항상 false로, 작은로 만들 수 있다는 점에서 그 P-값은 임의입니다 지적했다. 실제 세계에서는 정확히 0 인 반-부분 상관 관계가 없을 가능성이 있으며, 이는 회귀 계수의 중요성을 검정하는 귀무 가설입니다. P- 값 유의성 컷오프는 훨씬 임의적입니다. 중요성과 비 의미 사이의 컷오프 인 .05의 값은 원칙이 아닌 규칙에 따라 사용됩니다. 따라서 첫 번째 질문에 대한 답은 '아니오'입니다. 적절한 유의성 임계 값을 결정하는 원칙적인 방법은 없습니다.
대규모 데이터 세트를 고려할 때 무엇을 할 수 있습니까? 회귀 계수의 통계적 유의성을 탐색 한 이유에 따라 다릅니다. 복잡한 다중 요인 시스템을 모델링하고 현실에 합리적으로 적합하거나 예측하는 유용한 이론을 개발하려고하십니까? 그렇다면 Rodgers (2010), 수학 및 통계 모델링의 인식론에 설명 된대로보다 정교한 모델을 개발하고 모델링 관점을 고려할 수 있습니다. 많은 양의 데이터를 보유 할 경우 얻을 수있는 장점 중 하나는 다양한 수준과 흥미로운 상호 작용이있는 매우 다양한 모델을 탐색 할 수 있다는 것입니다 (변수가 있다고 가정).
반면에 특정 계수를 통계적으로 유의 한 것으로 취급할지 여부에 대한 판단을하려면 Woolley (2003)에 요약 된 Good 's (1982) 제안을 고려할 수 있습니다 .q- 값 계산 같은 p- 값을 100의 표본 크기로 표준화하는 ( n / 100 ) . 정확히 .001의 p- 값은 통계적으로 유의미한 p.045의 p- 값으로 변환됩니다.
따라서 임의의 임계 값이나 다른 임계 값을 사용하는 것이 중요하다면 무엇입니까? 이것이 관측 연구라면 모델을 잘못 지정했기 때문에 나타나는 가짜 관계가 아니라 생각하는 방식으로 실제로 의미가 있다는 것을 정당화하기 위해 훨씬 더 많은 노력이 필요합니다. 작은 효과는 치료 효과가 아닌 다른 수준의 치료를 선택하는 사람들 사이에 기존의 차이를 나타내는 경우 임상 적으로 그리 흥미롭지 않습니다.
댓글 작성자가 언급했듯이,보고있는 관계가 실제로 중요한지 여부를 고려해야합니다. 설명 된 분산에 대해 에서 r 2 로 인용 한 그림을 변환하면 ( r 은 상관 관계이며, 설명을 얻기 위해 제곱합니다) 각각 3 및 6 %의 분산을 설명하지만별로별로 보이지 않습니다.
쉽게 확인할 수있는 방법은 하나의 분포라는 두 배로 비슷한 수를 무작위로 샘플링하고 두 결과를 비교하는 것입니다. 여러 번 수행하고 유사한 p- 값을 관찰하면 실제 효과가 없음을 나타냅니다. 반면에 그렇지 않다면 아마도있을 것입니다.