범주 형 피쳐 (여기서는 위치)의 한 레벨이 회귀를위한 더미 인코딩 중에 참조 그룹이되고 중복되기 때문에 간단히 말하면됩니다. I 형은 인용하고 여기서 "K 종류 또는 레벨들의 범주 형 변수는 일반적으로 K-1 가변 수의 시퀀스로서 회귀 들어간다.이 양의 레벨 수단에 선형 가설."
이것은 이미이 아주 좋은 stats.stackexchange answer 에서 논의되었습니다 .
Yanra의 Coursera에 고급 과정이 있다고 들었는데, 의심 할 여지가없는 경우이 주제에 대해 자세히 설명합니다 . 여기를 참조 하십시오 . 언제든지 코스 내용을 무료로 감사 할 수 있습니다. ;-)
또 다른 멋진 포스트는 통계적 관점의 예를 많이하고있는 철저한 설명을 원하는 경우하지에 한정되는 경우에만 코딩 더미, 볼 이 UCLA에서 (R)에
를 사용하는 경우 첫 번째 수준을 제거하여 k 개의 범주 수준에서 k-1 인형을 가져올 지 여부를 pandas.get_dummies
나타내는 매개 변수가 drop_first
있습니다. default = False
참조가 삭제되지 않고 k 개의 카테고리 레벨에서 k 개의 인형이 생성됨을 유의하십시오 .