데이터가 지수 또는 정규 분포를 따르는 지 확인하기위한 표준 통계 검정은 무엇입니까?
데이터가 지수 또는 정규 분포를 따르는 지 확인하기위한 표준 통계 검정은 무엇입니까?
답변:
정규 분포 또는 지수 분포를 사용하여 데이터를 모델링할지 여부를 결정하려는 것 같습니다. 이 분포는 서로 매우 다르기 때문에 다소 이상한 것 같습니다.
정규 분포는 대칭 인 반면 지수 분포는 음수 값없이 오른쪽으로 크게 치우칩니다. 일반적으로 지수 분포의 샘플은 비교적 가까운 많은 관찰이 포함됩니다 과에서 오른쪽으로 멀리 벗어나 몇 obervations . 이 차이는 종종 그래픽으로보기 쉽습니다.0
여기서 I 시뮬레이션 한 예는 정규 분포의 평균과 관측 이고 분산 와 함께 평균 지수 분포 및 분산 :2 4 2 4
정규 분포의 대칭과 지수의 왜도는 위의 그림과 같이 히스토그램, 상자 그림 및 산점도를 사용하여 볼 수 있습니다.
또 다른 유용한 도구는 QQ-plot 입니다. 아래 예에서 표본이 정규 분포에서 나온 경우 점이 대략 선을 따라야합니다. 보시다시피, 이것은 정규 데이터의 경우이지만 지수 데이터의 경우에는 해당되지 않습니다.
어떤 이유로 그래픽 검사로 충분하지 않은 경우에도 검정을 사용하여 분포가 정규인지 지수인지를 결정할 수 있습니다. 정규 분포는 척도 및 위치 패밀리이므로 척도 및 위치의 변화에 따라 변하지 않는 검정을 사용하려고합니다 (즉, 측정 값을 인치에서 센티미터로 변경하거나 모든 관찰에 ).
귀무 가설은 정규 분포라고하고 다른 가설는, 지수 함수 인 것을 때 가장 강력한 위치 및 스케일 불변 시험 통계로 주어진다 여기서 는 표본 평균이고 은 표본에서 가장 작은 관측 값이고 는 표본 표준 편차입니다. 이 너무 크면 지수를 위해 정규성이 거부됩니다 .ˉ X X(1)STE,N
이 테스트는 실제로 특이점에 대한 Grubbs 테스트 의 단측 버전입니다 . 대부분의 통계 소프트웨어에서 구현 된 것을 알 수 있습니다 (그러나 올바른 버전을 사용해야합니다. 이상치 테스트에 사용되는 몇 가지 대체 테스트 통계가 있습니다!).
가장 강력한 테스트 인 에 대한 참조 : HC Thode의 정규성 테스트 섹션 4.2.4 .
지수 분포의 경우 Moran 또는 Bartlett의 테스트라는 테스트를 사용할 수 있습니다. 검정 통계량 은 기록 된 의 표본 평균 과 표본 평균 을 포함합니다. 귀무 가설 아래에 대략 및 양면 테스트 작업. 이 테스트는 감마 대안에 대해 설계되었습니다.¯ Y ¯ log Y Y i B n = b n × { log ˉ Y − ¯ log Y } B n ~ χ 2 ( n - 1 )
엔지니어링 설계의 KC Kapur 및 LR Lamberson 안정성을 참조하십시오 . 윌리 1977.
일반적으로 Anderson-Darling과 Shapiro-Wilk가 최고로 간주됩니다. 지수 식 Lillerfors 테스트를 위해 특별히 설계되었습니다.