범주 형 변수와 연속 변수가 모두 포함 된 데이터 세트가 있습니다. 범주 형 변수를 각 수준에 대한 이진 변수로 변환하는 것이 좋습니다 (예 : A_level1 : {0,1}, A_level2 : {0,1}). 일부는이 "더미 변수"라고합니다.
그렇게 말하면, 새로운 변수로 전체 데이터 세트를 중앙에 배치하고 스케일링하는 것이 오해의 소지가 있습니까? 마치 변수의 "켜기 / 끄기"의미를 잃는 것처럼 보입니다.
오해의 소지가있는 경우 연속 변수를 개별적으로 중앙에 배치하고 스케일을 조정 한 다음 데이터 세트에 다시 추가해야합니까?
티아.