Box and Whisker 그림에 대한 특이 표준 정의는 범위를 벗어난 점입니다. 여기서 및 은 첫 번째 사 분위수 및 데이터의 3 분위입니다.
이 정의의 기초는 무엇입니까? 점이 많으면 완전 정규 분포라도 특이 치를 반환합니다.
예를 들어 시퀀스로 시작한다고 가정합니다.
xseq<-seq(1-.5^1/4000,.5^1/4000, by = -.00025)
이 시퀀스는 4000 포인트의 백분위 수 순위를 만듭니다.
qnorm
이 시리즈의 정규성을 테스트하면 다음이 발생합니다.
shapiro.test(qnorm(xseq))
Shapiro-Wilk normality test
data: qnorm(xseq)
W = 0.99999, p-value = 1
ad.test(qnorm(xseq))
Anderson-Darling normality test
data: qnorm(xseq)
A = 0.00044273, p-value = 1
결과는 정확히 예상대로입니다 : 정규 분포의 정규성은 정상입니다. A를 만들기 qqnorm(qnorm(xseq))
(예상대로) 데이터의 직선을 만듭니다 :
동일한 데이터의 상자 그림이 생성되면 boxplot(qnorm(xseq))
결과 가 생성됩니다 .
상자 그림 달리 shapiro.test
, ad.test
또는 qqnorm
식별 여러 특이점 같은 점을 표본의 크기가 충분히 크기 (이 예에서와 같이).