클러스터 분석 결과를 검증하기 위해 통계적 유의성 테스트 (SST) 사용을 조사하고 있습니다. 이 주제와 관련하여 다음과 같은 여러 논문을 발견했습니다.
- " 높은 차원, 낮은 표본 크기 데이터에 대한 클러스터링의 통계 유의 사항 Fi를 cance 에 의해" 리우, Yufeng의 등. (2008)
- " 군집 분석의 일부 유의성 검정에서 ", Bock (1985)
그러나 SST가 군집 분석 결과를 검증하는 데 적합 하지 않다고 주장하는 문헌을 찾는 데 관심이 있습니다. 이것을 주장하는 유일한 소스는 소프트웨어 공급 업체 의 웹 페이지입니다.
명확히하기 위해 :
클러스터 분석의 결과로 중요한 클러스터 구조가 발견되었는지 테스트하는 데 관심이 있으므로 "탐색 데이터 결과의 사후 테스트 가능성에 대한 우려를지지하거나 반박하는 논문에 대해 알고 싶습니다. 클러스터를 찾는 데 사용됩니다 ".
방금 2003 년부터 Milligan과 Hirtle의 " 클러스터링 및 분류 방법 " 이라는 논문을 찾았습니다. 예를 들어, 데이터에 그룹에 대한 임의의 할당이 없기 때문에 ANOVA를 사용하는 것이 유효하지 않은 분석이 될 수 있다고합니다.