내 데이터 세트에는 많은 숫자 속성과 하나의 범주가 있습니다.
, 말 NumericAttr1, NumericAttr2, ..., NumericAttrN, CategoricalAttr
,
여기서,이 CategoricalAttr
세 개의 가능한 값 중 하나를 취 CategoricalAttrValue1
, CategoricalAttrValue2
또는 CategoricalAttrValue3
.
Octave https://blog.west.uni-koblenz.de/2012-07-14/a-working-k-means-code-for-octave/에 대한 기본 k- 평균 군집 알고리즘 구현을 사용하고 있습니다 . 숫자 데이터로만 작동합니다.
그래서 내 질문 : 범주 속성 CategoricalAttr
을 세 개의 숫자 (이진) 변수로 나누는 것이 맞 IsCategoricalAttrValue1, IsCategoricalAttrValue2, IsCategoricalAttrValue3
습니까?