모델을 작성 중이며 지리적 위치가 타겟 변수를 예측하는 데 매우 적합하다고 생각합니다. 각 사용자의 우편 번호가 있습니다. 그래도 모델에서 우편 번호를 예측 기능으로 포함시키는 가장 좋은 방법은 확실하지 않습니다. 우편 번호는 숫자이지만 숫자가 올라가거나 내려 가면 아무 의미가 없습니다. 30,000 개의 우편 번호를 모두 이진화 한 다음 기능이나 새 열로 포함 할 수 있습니다 (예 : {user_1 : {61822 : 1, 62118 : 0, 62444 : 0 등}}. 그러나 이것은 톤을 추가하는 것처럼 보입니다. 내 모델의 기능.
이 상황을 처리하는 가장 좋은 방법에 대한 생각이 있습니까?