바이 모달 분포의 중요성을 "테스트"하는 통계 테스트가 있는지 궁금합니다. 내 데이터가 바이 모달 분포를 얼마나 충족 시키는가? 그렇다면 R 프로그램에 테스트가 있습니까?
바이 모달 분포의 중요성을 "테스트"하는 통계 테스트가 있는지 궁금합니다. 내 데이터가 바이 모달 분포를 얼마나 충족 시키는가? 그렇다면 R 프로그램에 테스트가 있습니까?
답변:
이 문제에 대한 또 다른 가능한 접근 방식은 사용자가 보는 데이터를 생성하는 장면 뒤에서 무슨 일이 일어나고 있는지에 대해 생각하는 것입니다. 즉, 가우스 혼합 모델 과 같은 혼합 모델 측면에서 생각할 수 있습니다 . 예를 들어 데이터가 단일 정규 모집단 또는 평균과 분산이 다른 두 정규 분포 (일부 비율)의 혼합에서 가져온 것으로 생각할 수 있습니다. 물론 하나 또는 두 개만 있다고 믿지 않아도되며 데이터를 수집하는 모집단이 정상이어야한다고 믿지 않아도됩니다.
혼합 모델을 추정 할 수있는 두 개 이상의 R 패키지가 있습니다. 하나의 패키지는 flexmix 이고 다른 패키지는 mclust 입니다. 두 가지 후보 모델을 추정 한 결과 우도 비 검정을 수행 할 수 있다고 생각합니다. 또는 파라 메트릭 부트 스트랩 교차 피팅 방법 ( pdf )을 사용할 수도 있습니다 .
의견에서 언급했듯이 '바이 모달 분포'의 Wikipedia 페이지에는 단일성에 대한 다중 양식에 대한 8 가지 테스트 와 7 가지에 대한 참조가 제공됩니다.
R에는 최소한 일부가 있습니다. 예를 들면 다음과 같습니다.
이 패키지 diptest
는 Hartigan의 딥 테스트를 구현합니다.
패키지 의 stamp
데이터는 bootstrap
Efron 및 Tibshirani의 부트 스트랩 소개 (패키지 기반의 책)에서 모드 수에 따른 부트 스트랩 관련 예제를 수행하는 데 사용되었습니다. 책에 액세스 할 수있는 경우 해당 방법을 사용할 수 있습니다.
Efron, B. and Tibshirani, R. (1993) 부트 스트랩 소개 .
채프먼과 홀, 뉴욕, 런던.
-
CV에는 @whuber의 검색이 나타나는 모드의 수를 식별하는 것 (즉, 테스트보다는 추정) 에 관한 질문 이 있습니다. 거기에 대한 답변을 읽을 가치가 있습니다. 거기에 대한 답변 중 하나 (광산대로)는 David Donoho 가이 모드를 여러 가지 모드에 대해 일방적 인 CI를 구성하는 방법에 대한 이 논문 을 보여주는 Google 검색에 대한 링크를 가지고 있습니다 (예 : 테스트로 사용할 수 있음) 단측 구간에 단항 사례가 포함되지 않은 경우 단일성을 거부 할 수 있습니다. 내가 아는 한 내 지식으로 는Wikipedia에서 언급 한 테스트 중 하나입니다. 나는 그 간격의 R 구현이 없다고 생각하지만 (Donoho가 그것에 대해 토론 할 때 상당히 정교한 도구를 사용하는 경향이 있음에도 불구하고) 실제로 구현하는 것은 매우 간단한 아이디어입니다. 이 아이디어는 커널 밀도 추정을 사용한다는 개념과 직접 관련이 있습니다.