본질적으로 탐색적인 매우 다양한 클러스터링 방법이 있으며 계층 적이든 파티션 기반이든 상관없이 분산 분석을 위해 충족해야하는 가정에 의존한다고 생각하지 않습니다.
귀하의 질문에 답변하기 위해 Stata의 [MV] 문서를 살펴본 결과 85 페이지에서이 재미있는 인용문을 발견했습니다.
일부 사람들은 클러스터 분석을 수행하는 사람들이있는 것처럼 클러스터 분석 방법이 많다고 말했습니다. 이것은 심각한 과소 평가입니다! 클러스터 분석을 수행하는 사람들보다 클러스터 분석을 수행하는 방법이 무한히 많습니다.
그런 맥락에서 클러스터링 방법에 적용되는 가정이 있는지 의심합니다. 텍스트의 나머지 부분은 군집을 만들기 위해 미터 거리 일 필요도없는 "비 유사성 측정"형식이 필요하다는 일반적인 규칙으로 설정되어 있습니다.
그러나 사후 추정 분석의 일부로 관측치를 군집화하는 경우가 하나 있습니다. Stata에서 vce
명령은 동일한 소스의 86 페이지에 다음 경고와 함께 제공됩니다.
Stata의 대규모 추정 명령 배열에 익숙한 경우 군집 분석 (클러스터 명령)과 많은 추정 명령에 허용되는 vce (cluster clustvar) 옵션을 구분해야합니다. 군집 분석은 데이터에서 그룹을 찾습니다. 다양한 추정 명령과 함께 허용되는 vce (cluster clustvar) 옵션은 관측치가 옵션에 의해 정의 된 그룹에서 독립적이지만 반드시 해당 그룹 내에서 독립적 일 필요는 없음을 나타냅니다. cluster 명령으로 생성 된 그룹화 변수는 vce (cluster clustvar) 옵션 사용에 대한 가정을 거의 만족시키지 않습니다.
이를 바탕으로, 나는 그 특별한 경우를 제외하고 독립적 인 관찰이 필요하지 않다고 가정 할 것입니다. 직관적으로, 나는 클러스터 분석이 관측치가 독립적인지 아닌지를 탐구하는 정확한 목적으로 사용될 수 있다고 덧붙일 것입니다.
나는에, 그 언급으로 마무리됩니다 356 페이지 의 STATA과 통계 그는이 문제에 대한 자세한 깊이로 전환되지 않지만 로렌스 해밀턴, 클러스터 분석의 "필수"측면으로 변수를 표준화 언급한다.