기능 공학에 대한 실질적인 질문이 있습니다 ... 로지스틱 회귀를 사용하여 주택 가격을 예측하고 우편 번호를 포함하여 많은 기능을 사용했다고 가정합니다. 그런 다음 기능의 중요성을 확인하여 zip이 꽤 좋은 기능이라는 것을 알고 있으므로 zip을 기반으로 기능을 추가하기로 결정했습니다. 예를 들어 인구 조사국에 가서 평균 수입, 인구, 학교 수 및 수를 얻습니다. 각 우편의 병원. 이 네 가지 새로운 기능으로 모델 성능이 향상되었습니다. 더 많은 우편 관련 기능을 추가합니다.이주기는 계속 진행됩니다. 결국이 지퍼 관련 기능이 모델을 지배하게 될 것입니다.
내 질문 :
- 처음에 이것을하는 것이 합리적입니까?
- 그렇다면 언제이주기를 중단하기에 좋은시기인지 어떻게 알 수 있습니까?
- 그렇지 않다면 왜 안됩니까?