잔차가 정규 분포인지 확인하기 위해 어떤 테스트를 사용합니까?


20

잔차 대 시간의 그래프를 거의 정상으로 플롯하여 볼 수있는 데이터가 있지만 확실하게하고 싶습니다. 오차 잔차의 정규성을 어떻게 테스트 할 수 있습니까?


3
밀접한 관련 : 작은 표본에 대한 적절한 정규성 검정 . 여기에 가능한 관심의 다른 몇 가지 질문은 다음과 같습니다 - 정상 - 테스트하고 - 본질적으로-쓸모없는 , 정상 테스트의 가치에 대한 논의를 위해, 무엇을-경우 - 잔차 - - 보통 - 분산되지만-Y-은 - 아니 , 토론을 위해 / 감각의 설명이있는 정상은 선형 모델의 가정이다.
gung-모니 티 복원

Shapiro Wilk 테스트의 요지에 대한 매우 일반적인 오해가 있습니다! H0에 유리한 의미는 H0를 기각 할 수 없지만주의해야합니다! "데이터가 정상적으로 배포 됨"을 자동으로 의미하지는 않습니다 !!! 다른 결과는 "데이터가 정상적으로 배포되지 않습니다"입니다.
Joe Hallenbeck

답변:


28
  1. 잔차가 정상적으로 분포되어 있음을 나타내는 테스트는 없습니다. 사실, 당신은 그들이 아닌 것을 확실하게 내기 할 수 있습니다 .

  2. 가설 검정은 일반적으로 가정을 확인하는 것이 좋지 않습니다. 비정규 성이 추론에 미치는 영향은 일반적으로 표본 크기의 함수가 아니지만 유의성 검정의 결과 는 다음과 같습니다 . 실제 관심의 문제에 대한 대답 ( '이것이 내 추론에 어느 정도 영향을 미쳤는가?')에도 불구하고, 표본 크기가 크면 정규성에서 약간 벗어난 것이 분명 할 것입니다. 이에 따라 작은 표본 크기에서 정규성에서 큰 편차가 유의성에 접근하지 않을 수 있습니다.

    * (편집에 추가됨)-실제로는 너무 약한 진술입니다. 비정규 성의 영향은 실제로 CLT와 Slutsky의 정리가 유지 될 때마다 표본 크기에 따라 거의 감소하는 반면, 정규성을 기각하는 능력 (및 아마도 정규 이론 절차를 피할 수있는)은 표본 크기에 따라 증가합니다. 어쨌든 중요하지 않은 경우가 아닌 비정규 성을 식별 할 수 있습니다 ... 작은 샘플에서 테스트는 실제로 중요 할 때 도움이되지 않습니다.

    최소한 유의 수준까지는 그렇습니다. 여기서처럼 큰 샘플을 고려한다면 전력은 여전히 ​​문제가 될 수 있습니다.

  3. 효과 크기 측정에 더 가까운 것은 어떤 방식으로 비정규도를 측정하는 진단 (디스플레이 또는 통계)입니다. QQ 도표는 명백한 표시이며, 하나의 표본 크기와 다른 표본 크기에서 동일한 모집단의 QQ 도표는 적어도 동일한 곡선의 노이즈 추정치 입니다. 이는 거의 동일한 '비정규 성'을 나타 냅니다 . 적어도 관심있는 질문에 대한 원하는 답변과 단조롭게 관련되어야합니다.

테스트를 사용해야하는 경우 Shapiro-Wilk는 아마도 다른 것만 큼 좋습니다 (Chen-Shapiro 테스트는 일반적으로 일반적인 관심 대안에 대해서는 조금 낫지 만 구현 방법을 찾기는 어렵습니다). 그러나 그것은 당신에게 질문에 대한 답변입니다. 에 대한 답을 이미 알고있다. 당신이 거부하지 못할 때마다, 당신이 확신 할 수있는 대답을하고 있습니다.


4
몇 가지 좋은 지적을했기 때문에 Glen_b +1. 그러나 나는 적합도 테스트의 사용에 대해 그렇게 부정적이지 않을 것입니다. 표본 크기가 작거나 중간이면 검정은 정규 분포에서 약간 벗어난 것을 감지하기에 충분한 검정력을 갖지 않습니다. 매우 큰 차이로 인해 p- 값이 매우 작을 수 있습니다 (예 : 0.0001 이하). 이것은 qq 플롯의 시각적 관찰보다 공식적인 표시 일 수 있지만 여전히 매우 유용합니다. 또한 왜도 및 첨도 추정치를 볼 수 있습니다. 적합도의 우수성에 문제가있는 것은 매우 큰 표본입니다.
Michael R. Chernick

4
이 경우 작은 출발이 감지됩니다. 분석가가 실제로 모집단 분포가 정확히 정상적이지 않다는 것을 인식하고 귀영 합법을 거부하는 것이 그의 분포가 약간 비정규 적이라고 말하면, 그는 타락하지 않을 것입니다. 그런 다음 조사관은 정규성 가정이 시험에서 감지 한 약간의 이탈이 우려되는지의 여부를 스스로 판단해야합니다. Shapiro-Wilk는 실제로 정규성 가설에 대한 더 강력한 테스트 중 하나입니다.
Michael R. Chernick

+1, 특히 포인트 # 2를 좋아합니다. 이러한 선을 따라, 왜 크거나 첨도가 상당히 나쁘거나 N이 너무 크더라도 Central Limit Theorem이 당신을 커버 할 것이므로 정규성 이 가장 필요한 시간 입니다.
gung-모니 티 복원

3
@ gung 정규성에 대한 근사치가 중요한 상황이 있습니다. 예를 들어, 일반적인 가정을 사용하여 예측 구간을 구성 할 때. 그러나 나는 아직도 테스트보다 진단에 더 의존 할 것이다.
Glen_b -Reinstate Monica

예측 구간에 대한 요점은 좋은 것입니다.
gung-Monica Monica 복원

8

Shapiro-Wilk 테스트는 하나의 가능성입니다.

샤피로-와일 크 테스트

이 테스트는 거의 모든 통계 소프트웨어 패키지에서 구현됩니다. 귀무 가설은 잔차가 정규 분포를 따르고 있으므로 작은 p- 값은 귀무를 거부하고 잔차가 정규 분포를 따르지 않는다는 결론을 내립니다.

표본 크기가 크면 거의 항상 기각하므로 잔차를 시각화하는 것이 더 중요합니다.


"Wilks"가 아닌 "Wilk"입니다.
Michael R. Chernick

1

위키 백과에서 :

일 변량 정규성 검정에는 D' Agostino의 K- 제곱 검정, Jarque-Bera 검정, Anderson-Darling 검정, Cramér-von Mises 기준, Lilliefors 검정 정규성 (Kolgogorov-Smirnov 검정의 적응), Shapiro–Wilk 테스트, Pearson의 카이 제곱 테스트 및 Shapiro–Francia 테스트. 통계 모델링 및 분석 저널 (The Journal of Statistical Modeling and Analytics)의 2011 논문에 따르면 Shapiro-Wilk는 주어진 의미에 대해 최고의 힘을 가지고 있으며 Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors 및 Anderson- 달링 테스트


1
-1 : Wikipedia 페이지에 대한 링크를 포함시키고 각주 ( "[1]")를 제거하고 블록 인용 기능을 사용할 수 있습니다.
Bernd Weiss

1
Glen_b가주는주의 사항은 이러한 적합도 테스트를 사용할 때마다 명심해야합니다. 나는 당신이 Shapiro-Wilk에 대해 당신이 정한 결과가 당신이 만드는 것만 큼 일반적이지 않다고 생각합니다. 나는 세계적으로 가장 강력한 정규성 검정이 있다고 믿지 않습니다.
Michael R. Chernick

2
@MichaelChernick 저는 SnowsPenultimateNormalityTest (R의 TeachingDemos 패키지 ( cran.r-project.org/web/packages/TeachingDemos/TeachingDemos.pdf ) 에서 구현 됨)가 세계에서 가장 강력한 테스트 (1). 그러나 테스트 / 기능에 대한 문서가 테스트 / 기능 자체보다 유용하다고 생각합니다.
Greg Snow

@GregSnow 나는 당신의 패키지를 철저히 살펴볼 시간이 없으며 R을 사용하여 모든 것을 따르기에 충분하지 않을 수도 있습니다. 전 세계적으로 가장 강력한 정규성 검정이 있거나 다양한 검정이 가장 강력한시기를 나타 내기위한 예를 제공하여 전 세계적으로 존재하지 않는다고 말하는 것입니까? 나는 그것이 존재한다는 의심을 가지고 있으며 Shapiro-Wilk가 그렇게 될 것이라고 생각하지 않습니다. 당신이 존재한다고 주장한다면, 나는 수학적 증거 나 그에 대한 참조를보고 싶습니다.
Michael R. Chernick

1
@ MichaelChernick, 나의 주장은 내 테스트는 다른 정규성 테스트만큼 많은 힘을 가질 것입니다 (정확한 법칙에서 오는 데이터의 귀무 가설을 기각 할 가능성이 높습니다). R 코드는 따르기가 어렵지 않고 p- 값을 계산하기위한 핵심 코드는 "tmp.p <-if (any (is.rational (x))) {0"이며 그 힘의 증거는 분명해야합니다 ( 나는 단지 그것이 강력하고 문서가 유용 할 수 있다고 주장했다. 테스트 자체가 유용하지는 않다. 구글의 "Cochrane 's aphorism")
Greg Snow
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.