Shapiro-Wilk 테스트의 해석


29

통계가 처음이므로 도움이 필요합니다.
다음과 같이 작은 샘플이 있습니다.

  H4U
  0.269
  0.357
  0.2
  0.221
  0.275
  0.277
  0.253
  0.127
  0.246

R을 사용하여 Shapiro-Wilk 테스트를 실행했습니다.

shapiro.test(precisionH4U$H4U)

그리고 나는 다음과 같은 결과를 얻었다 :

 W = 0.9502, p-value = 0.6921

이제 p- 값보다 0.05의 유의 수준이 알파보다 크면 (0.6921> 0.05) 정규 분포에 대한 귀무 가설을 기각 할 수 없지만 표본에 정규 분포가 있다고 말할 수는 있습니다. ?

감사!

답변:


28

아니요- "표본에 정규 분포가 있음"또는 "표본이 정규 분포를 갖는 모집단에서 나옴"이라고 말할 수는 없지만 "표본이 정규 분포를 가진 모집단에서 나왔다는 가설"만 거부 할 수는 없습니다.

실제로 표본은 정규 분포를 갖지 않지만 ( 아래 의 qqplot 참조) 단지 표본 일 것으로 예상하지는 않습니다. 기초 인구 분포에 관한 문제는 여전히 열려 있습니다.

qqnorm( c(0.269, 0.357, 0.2, 0.221, 0.275, 0.277, 0.253, 0.127, 0.246) )

qqplot


2
qqplot은 평범한 것 같아요 ... qqnorm(rnorm(9))여러 번 시도 할 수 있습니다 ...
Curious

2
@Tomas : 아마도 "qqplot이 일반 인구에서 온 것처럼 보인다"고 말하는 것이 좋습니다. 대신 더 두꺼운 꼬리를 가진 분포에서 나왔을 수 있습니다.
헨리

예, qqnorm(runif(9))비슷한 결과를 낼 수 있습니다. 그래서 우리는 실제로 아무 말도 할 수 없습니다 ...
Curious

"표본에 정규 분포가 있습니다"와 "표본이 정규 분포를 가진 모집단에서 나온 것"의 차이점은 무엇입니까?
auraham

1
정규 분포는 모든 실수에 대한 연속 분포입니다. 이 분포를 가진 모집단에서 추출한 표본 (유한 또는 심지어 무한으로 무한한)은 이러한 종류의 분포 자체를 가질 수 없습니다.
Henry

17

귀무 가설을 기각하지 못한다는 것은 가지고있는 표본이 너무 작아서 정규성에서 벗어난 것을 포착 할 수 없다는 것을 나타냅니다. 그러나 표본이 너무 작아서 정규성에서 실질적으로 벗어난 편차도 감지되지 않을 수 있습니다.

그러나 가설 검정은 사람들이 정규성 검정을 사용하는 대부분의 경우와 거의 비슷합니다. 실제로 테스트하려는 질문에 대한 답을 알고 있습니다. 데이터에서 모집단의 분포는 정상 이 아닙니다. . (때로는 꽤 가깝지만 실제로는 정상입니까?)

주의해야 할 질문은 '정규에서 도출 된 분포'가 아닙니다 (그렇지 않습니다). 실제로 관심을 가져야 할 질문은 '정상 성과의 편차가 결과에 실질적으로 영향을 미치나요?'입니다. 잠재적 인 문제인 경우 해당 문제가 발생할 가능성이 적은 분석을 고려할 수 있습니다.


10

통계에 익숙하지 않다는 점을 고려할 때, 이는 평균 추정치의 잔차이므로 정규 분포 가정이 분포를 사용한 신뢰도 추정에 유효한지 알고 싶을 것으로 생각합니다 .

t 검정은 이러한 가정을 위반하는 데 상당히 강하고, Henry의 qq 플롯에서 데이터가 모호하게 정상으로 보이며 Shapiro 검정은 데이터가 비정규 분포를 가진 모집단에서 나온 것임을 나타내지 않습니다. 테스트가 적합합니다.

나는 당신이 비율을보고 있다고 추측합니다.이 경우 가정 위반에 대해 염려한다면 이항 분포를 사용할 수 있습니다.

Shapiro 테스트에 대한 다른 우려가 있다면 방금 말한 모든 것을 무시할 수 있습니다.


맞습니다. 샘플에 t 테스트를 사용할 수 있는지 알고 싶었습니다. 감사!
Jakub

4

헨리는 이미 말했듯이 정상이라고 말할 수 없습니다. R에서 다음 명령을 여러 번 실행하십시오.

shapiro.test(runif(9)) 

균일 분포에서 9 개의 숫자 샘플을 테스트합니다. 여러 번 p- 값이 0.05보다 훨씬 커질 것이므로 분포가 정규적이라고 결론을 내릴 수 없습니다.


4

나는 또한 Shapiro-Wilk 테스트에서 W 값 을 올바르게 해석하는 방법을 찾고 있었고 Emil OW Kirkegaard 의 기사 " Shapiro-Wilk 테스트의 W 값이 다른 데이터 세트로 시각화되어 있음 "에 따르면 W 값만 보고 분포 .

그는 결론적으로 말했듯이 :

일반적으로 표본이 크면 SW가 비정규 성에서 벗어나는 것에 민감하다는 것을 알 수 있습니다. 그러나 출발이 매우 작은 경우에는 그다지 중요하지 않습니다.

또한 의도적으로 시도하더라도 W 값을 줄이는 것이 어렵다는 것을 알 수 있습니다. .99 이하로 떨어지기 위해서는 극도로 비정규 분포를 테스트해야합니다.

자세한 내용은 원본 기사를 참조하십시오.


1

이전 답변에서 언급하지 않은 중요한 문제는 테스트 제한 사항입니다.

테스트에는 한계가 있으며, 가장 중요한 것은 테스트가 샘플 크기에 따른 치우침을 갖는 것 입니다. 표본이 클수록 통계적으로 유의미한 결과를 얻을 수 있습니다.

원래 질문 (매우 작은 표본 크기)에 대한 답변 : 이 특정 사례에 대한 QQ 플롯 및 히스토그램과 같은 더 나은 대안 에 대한 다음 기사를 참조하십시오 .

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.