광범위하게 말하면 (적합한 적합성 테스트뿐만 아니라 다른 많은 상황 에서도) 주어진 샘플 크기에서 널과 효과적으로 구별 할 수있는 대안이 있기 때문에 널이 참이라고 결론을 내릴 수 없습니다 .
표준 정규선 (녹색 실선)과 비슷한 모양 (90 % 표준 정규선, 10 % 표준화 된 베타 (2,2), 빨간색 점선으로 표시)이 있습니다.
빨간색은 정상이 아닙니다. 말에서 대신 빨간색 같은 비 정규 분포에서 무엇을한다면 - 우리가 데이터 주장 정규 분포에서 작성한 할 수 있도록, 우리는 차이를 안보의 작은 기회가?n = 100
동일하지만 더 큰 매개 변수를 가진 표준화 된 베타의 작은 부분은 정상과 다른 것으로보기가 훨씬 더 어려울 것입니다.
그러나 실제 데이터가 거의 없음을 주어 결코 우리가 완벽한 신탁 (또는 효과적으로 무한 샘플 크기)이 있다면, 몇 가지 간단한 분배에서, 우리는 본질적 것입니다 항상 데이터가 몇 가지 간단한 분배 양식에서 있었다는 가설을 거부합니다.
으로 조지 상자는 유명 넣어 , " 모든 모델은 잘못이지만, 일부는 유용합니다. "
예를 들어, 정규성 테스트를 고려하십시오. 데이터가 실제로 정상에 가까운 것에서 온 것일 수도 있지만 정확히 정상일까요? 그들은 아마 없을 것입니다.
대신, 이러한 형태의 테스트로 기대할 수있는 최선은 설명하는 상황입니다. (참조, 예를 들어, 포스트는 정상이? 본질적으로 쓸모 테스트하고 있지만, 관련 사항을 여기에 다른 게시물의 숫자가 있습니다)
이것은 사람들이 실제로 관심있는 질문에 자주 제안하는 이유의 일부입니다 ( '분류 에 근거하여 적절한 추론을 할 수 있을 정도로 데이터가 충분히 가깝 습니까?'). 적합도 테스트에 의해 정답이 아닙니다. 정상의 경우, 종종 추론 절차는 그들이 (t-테스트, 회귀 분석 등)을 적용 할 큰 샘플에서 아주 잘 작동하는 경향이 - 원래의 분포가 매우 명확하게 비 정상적인 종종 경우에도 - 단지 때 선 (善) 적합 검정은 정규성을 기각 할 가능성이 매우 높습니다 . 질문이 중요하지 않은 경우에만 데이터가 정상적이지 않다는 것을 알려주는 절차가 거의 사용되지 않습니다.에프
위의 이미지를 다시 고려하십시오. 적색 분포는 비정규이며, 표본이 매우 크면 표본을 바탕으로 정규성 검정을 기각 할 수 있습니다. 게다가)는 비정규성에 대해 조금이라도 걱정할 정도로 무의미하게 행동합니다.
비슷한 고려 사항은 다른 분포뿐만 아니라 더 많은 양의 가설 검정 (일반적으로 의 양측 검정 )까지 확대됩니다. - 하나는뿐만 아니라 질문의 같은 종류 요청할 수 있습니다 우리가 평균이 특정 값을 사용할지 여부를 결론 지을 수없는 경우 이러한 테스트를 수행하는 점은 무엇입니까?μ = μ0
특정 형태의 편차를 지정하고 동등성 검정과 같은 것을 볼 수는 있지만, 분포가 가정 된 것과 비슷하지만 다른 방법으로 분포가 다양하기 때문에 적합도에 따라 까다로울 수 있습니다. 차이의 형태는 분석에 다른 영향을 미칠 수 있습니다. 대안이 널 (null)을 특수한 경우로 포함하는 더 넓은 제품군 인 경우 동등성 테스트가 더 의미가 있습니다 (예 : 감마에 대한 지수 테스트). 실제로 "두 개의 일방적 테스트"접근 방식이 수행되며 이는 "충분히 가깝게"공식화하는 방법이어야합니다 (또는 감마 모델이 참인 경우 일 수도 있지만 실제로는 일반적인 적합도 테스트에 의해 거부되는 것이 확실합니다.
적합도 검정 (및 더 광범위하게 가설 검정)은 실제로 제한된 범위의 상황에만 적합합니다. 사람들이 일반적으로 대답하고자하는 질문은 너무 정확하지는 않지만 다소 모호하고 대답하기가 더 어렵습니다. 그러나 John Tukey가 말했듯이 " 올바른 질문에 대한 정확한 답보다 모호한 올바른 질문에 대한 대략적인 대답이 훨씬 낫습니다. " 정확하게 만들 수있는 잘못된 질문입니다. "
더 모호한 질문에 대답하기위한 합리적인 접근법에는 사용 가능한 데이터와 합리적으로 일치하는 다른 상황에 비해 고려중인 가정에 대한 원하는 분석의 민감도를 평가하기위한 시뮬레이션 및 리샘플링 조사가 포함될 수 있습니다.
(또한 이것은 오염을 통한 견고성에 대한 접근 방식의 기초의 일부입니다. 본질적으로 Kolmogorov-Smirnov 의미에서 특정 거리 내에있을 때의 영향을 살펴봄으로써)ε