정규성 검사는 그래픽 검사의 동반자로서 유용 할 수 있다고 생각합니다. 그러나 올바른 방법으로 사용해야합니다. 내 생각에 이것은 Shapiro-Wilk, Anderson-Darling 및 Jarque-Bera 테스트와 같은 많은 인기있는 테스트를 사용해서는 안된다는 것을 의미합니다.
내 견해를 설명하기 전에 몇 가지 언급을하겠습니다.
- 흥미로운 최근 논문에서 Rochon et al. Shapiro-Wilk 테스트가 2- 표본 t- 테스트에 미치는 영향을 연구했습니다. 예를 들어 t- 검정을 수행하기 전에 정규성을 테스트하는 2 단계 절차에는 문제가 없습니다. 다시, t- 검정을 수행하기 전에 정규성을 그래픽으로 조사하는 2 단계 절차도 마찬가지입니다 . 차이점은 후자의 영향을 조사하기가 훨씬 어렵다는 것입니다 (통계 학적으로 번 정도의 정규성을 조사하려면 통계학자가 필요하기 때문에 ...).100,000
- 예를 들어 공식 테스트를 원하지 않더라도 샘플 왜도를 계산하여 비정규 성 을 정량화하는 것이 유용합니다 .
- 다변량 정규성은 그래픽으로 평가하기 어려울 수 있으며, 다변량 통계의 경우 점근 분포에 대한 수렴이 느려질 수 있습니다. 따라서 다변량 설정에서 정규성 검정이 더 유용합니다.
- 정규성 검정은 통계를 일련의 블랙 박스 방법으로 사용하는 실무자에게 특히 유용합니다 . 정규성이 기각 될 경우, 실무자는 경각심을 가져야하며 정규성을 가정하여 표준 절차를 수행하는 대신 비모수 적 절차를 사용하거나 변환을 적용하거나보다 숙련 된 통계 전문가와상의하는 것이 좋습니다.
- 다른 사람들이 지적했듯이 이 충분히 크면 CLT는 일반적으로 하루를 절약합니다. 그러나 "충분히 큰"항목은 배포 클래스에 따라 다릅니다.n
(제 정의에서) 정규성에 대한 테스트는 해당 클래스의 대안에 민감하지만 다른 클래스의 대안에 민감하지 않은 경우 대안 클래스에 대해 지시됩니다. 전형적인 예는 비대칭 또는 첨도 대안에 대한 테스트입니다 . 가장 간단한 예제는 샘플 왜도 및 첨도를 테스트 통계로 사용합니다.
지시 된 정규성 검사는 옴니버스 검사 (예 : Shapiro-Wilk 및 Jarque-Bera 검사)보다 종종 선호됩니다 . 특정 비정규 성 유형 만 특정 추론 적 절차에 관심이 있기 때문에 일반적입니다 .
Student 's t-test를 예로 들어 봅시다. 왜도 및 (과도한) 첨도경우 그 평균에 대한 대칭 . 두 및 정규 분포 0입니다.γ=E(X−μ)3σ3κ=E(X−μ)4σ4−3.Xγ=0γκ
규칙적 가정 하에서 검정 통계량 의 cdf에 대해 다음과 같은 점근 확장 을 .
TnP(Tn≤x)=Φ(x)+n−1/216γ(2x2+1)ϕ(x)−n−1x(112κ(x2−3)−118γ2(x4+2x2−3)−14(x2+3))ϕ(x)+o(n−1),
여기서 는 cdf이고 는 표준 정규 분포의 pdf입니다.Φ(⋅)ϕ(⋅)
γ 는 용어 에서 처음으로 나타나는 반면 는 용어 에서 나타납니다 . 의 점근 적 성능 은 첨도 형태보다 왜곡 형태의 정규성 편차에 훨씬 더 민감합니다.n−1/2κn−1 T nTn
작은 에서도 마찬가지임을 시뮬레이션을 사용하여 확인할 수 있습니다 . 따라서 스튜던트 t- 검정은 왜도에 민감하지만 두꺼운 꼬리에 대해서는 상대적으로 견고 하므로 t- 검정을 적용하기 전에 기울기 대안에 대한 정규성 검정을 사용하는 것이 합리적 입니다.n
A와 엄지 손가락의 규칙 ( 없는 자연의 법칙), 수단에 대한 추론은 첨도에 민감 차이에 대해 왜도 및 추론에 민감합니다.
정규성에 대한 직접 테스트를 사용하면``위험한 ''대안에 대해 더 높은 검정력을 얻고``위험한 ''덜 대안에 대해 더 낮은 검정력을 얻는 이점이 있습니다. 즉, 정규성에서 벗어난 규칙으로 인해 정규성을 거부 할 가능성이 적습니다. 우리의 추론 절차의 수행에는 영향을 미치지 않습니다. 비정규 성은 당면한 문제와 관련이있는 방식으로 정량화됩니다. 이것은 항상 그래픽 적으로 쉬운 일이 아닙니다.
으로 커질수록, 왜도 및 첨도는 덜 중요하게 - 감독 시험이 수량도 적은 양에 의해 0에서 벗어나는 경우 감지 할 가능성이 높다. 이러한 경우, 예를 들어 또는 (위 확장의 첫 번째 용어를보고) 테스트하는 것이 합리적 입니다. 대신 인지 여부 . 이것은 이 커짐에 따라 우리가 직면하는 문제 중 일부를 처리합니다 .n|γ|≤1|n−1/216γ(2z2α/2+1)ϕ(zα/2)|≤0.01
γ=0n