잔차의 정규성 검정에 의존하기보다는 합리적인 판단으로 정규성을 평가하십시오. 정규성 테스트는 데이터가 정상임을 나타내지 않으며 그렇지 않다는 것을 알려줍니다. 그러나 데이터가 샘플이므로 테스트 없이는 실제로 정상적이지 않다는 것을 확신 할 수 있습니다. 요구 사항은 거의 정상입니다. 시험은 당신에게 말할 수 없습니다. 테스트는 또한 큰 N에서 또는 그보다 더 심각하게 매우 민감 해지며 N에 따라 감도가 다양합니다. N은 감도가 높아지기 시작하는 범위에 있습니다. R에서 다음과 같은 시뮬레이션을 여러 번 실행하고 그림을 보면 정규성 검정이 많은 정규 분포에 대해 "정상이 아님"이라는 것을 알 수 있습니다.
# set the plot area to show two plots side by side (make the window wide)
par(mfrow = c(1, 2))
n <- 158 # use the N we're concerned about
# Run this a few times to get an idea of what data from a
# normal distribution should look like.
# especially note how variable the histograms look
y <- rnorm(n) # n numbers from normal distribution
# view the distribution
hist(y)
qqnorm(y);qqline(y)
# run this section several times to get an idea what data from a normal
# distribution that fails the normality test looks like
# the following code block generates random normal distributions until one
# fails a normality test
p <- 1 # set p to a dummy value to start with
while(p >= 0.05) {
y <- rnorm(n)
p <- shapiro.test(y)$p.value }
# view the distribution that failed
hist(y)
qqnorm(y);qqline(y)
시뮬레이션을 수행 한 후에는 정규성 테스트를 통해 정규적으로 보이는 데이터를 쉽게 거부 할 수 있으며 정규 분포의 데이터는 정규에서 멀리 떨어져있는 것처럼 보일 수 있습니다. 당신이 그 극단적 인 가치를보고 싶다면 시도하십시오 n <- 1000
. 분포는 모두 정상적으로 보이지만 더 낮은 N 값과 거의 같은 속도로 테스트에 실패합니다. 반대로, 테스트를 통과하는 N 분포가 낮 으면 정규와 매우 거리가 멀어 보일 수 있습니다.
SPSS의 표준 잔차 그림은 정규성을 평가하는 데 크게 유용하지 않습니다. 특이 치, 범위, 적합도 및 레버리지를 볼 수 있습니다. 그러나 정규성은 그것으로부터 도출하기 어렵다. 히스토그램, Quantile-quantile 노멀 플롯 및 잔차 플롯을 비교하여 다음 시뮬레이션을 시도하십시오.
par(mfrow = c(1, 3)) # making 3 graphs in a row now
y <- rnorm(n)
hist(y)
qqnorm(y); qqline(y)
plot(y); abline(h = 0)
마지막 줄거리에서 정상 또는 많은 것을 말하기가 매우 어렵 기 때문에 정상 진단이 심각하지 않습니다.
요약하면 일반적으로 정규성 검정에 의존하지 않고 잔차의 진단 플롯에 의존하는 것이 좋습니다. 이러한 플롯이나 질문에 실제 값이 없으면 누구든지 분석 또는 변환 측면에서 데이터에 필요한 사항에 대한 확실한 조언을 제공하기가 매우 어렵습니다. 최상의 도움을 받으려면 원시 데이터를 제공하십시오.