변수에 가중치를 할당하는 한 가지 방법은 스케일을 변경하는 것입니다. 이 트릭은 언급 한 클러스터링 알고리즘, 즉 작동합니다. k- 평균, 가중 평균 연계 및 평균 연계.
Kaufman, Leonard 및 Peter J. Rousseeuw. " 데이터에서 그룹 찾기 : 군집 분석 소개 ." (2005)-11 페이지 :
측정 단위를 선택하면 변수의 상대적 가중치가 발생합니다. 더 작은 단위로 변수를 표현하면 해당 변수의 범위가 더 커져 결과 구조에 큰 영향을 미칩니다. 반면에 표준화를 통해 객관성을 달성하기 위해 모든 변수에 동일한 가중치를 부여하려고합니다. 따라서 사전 지식이없는 실무자가 사용할 수 있습니다. 그러나 특정 응용 분야에서 일부 변수가 본질적으로 다른 변수보다 더 중요 할 수 있으며, 가중치 할당은 주제에 관한 지식을 바탕으로해야합니다 (예 : Abrahamowicz, 1985 참조).
한편, 변수의 규모와 무관 한 군집 기법을 고안하려는 시도가 있었다 (Friedman and Rubin, 1967). Hardy and Rasson (1982)의 제안은 클러스터의 볼록 껍질의 총 부피를 최소화하는 파티션을 검색하는 것입니다. 원칙적으로 이러한 방법은 데이터의 선형 변환과 관련하여 변하지 않지만 불행히도 구현에 알고리즘이 존재하지 않습니다 (2 차원으로 제한된 근사치 제외). 따라서 표준화의 딜레마는 현재 피할 수없는 것으로 보이며이 책에 설명 된 프로그램은 사용자에게 선택권을 남겨 둡니다.
Abrahamowicz, M. (1985), 비 유사성 측정을위한 비 숫자 pnon 정보의 사용, 영국의 캠브리지 (Cambridge)에서 7 월 2-5 일, 제 4 차 유럽 심리 학회 및 분류 사회 회의에서 발표 된 논문.
Friedman, HP 및 Rubin, J. (1967), 데이터 그룹화에 대한 일부 불변 기준. 제이 . 아 메르 통계 학자. ASSOC6., 2, 1159-1178.
Hardy, A. 및 RaP, JP (1982), Une nouvelle은 분류 자동, Statist에 대한 문제에 접근한다. 항문 도니, 7, 41-56.