어떤 상황에서 모형 적합 전에 변수를 스케일하거나 표준화하지 않겠습니까? 그리고 변수 스케일링의 장단점은 무엇입니까?
어떤 상황에서 모형 적합 전에 변수를 스케일하거나 표준화하지 않겠습니까? 그리고 변수 스케일링의 장단점은 무엇입니까?
답변:
표준화는 모델에 대한 다양한 변수의 가중치에 관한 것입니다. 수치 적 안정성을 위해 표준화 만한다면, 수치 적 특성이 매우 유사하지만 해석에보다 적합한 물리적 의미가 다른 변환이있을 수 있습니다. 센터링의 경우도 마찬가지이며, 이는 표준화의 일부입니다.
표준화하려는 상황 :
표준화하고 싶지 않은 상황 :
새 변수가 여전히 물리적 인 의미를 갖지만 숫자 값의 변동이 그다지 다르지 않도록 "사이에"무언가를 수행하고 변수를 변환하거나 단위를 선택할 수 있습니다.
센터링과 유사 :
일반적으로 반드시 필요한 경우가 아니면 스케일링 또는 표준화를 권장하지 않습니다. 이러한 공정의 장점 또는 매력은 설명 변수가 반응 변수와 물리적 치수와 크기가 완전히 다를 때 표준 편차로 나눈 배율 조정이 수치 안정성 측면에서 도움이 될 수 있으며 여러 변수에 걸쳐 효과를 비교할 수 있다는 것입니다 설명 변수. 가장 일반적인 표준화에서 변수 효과는 설명 변수가 1 표준 편차만큼 증가 할 때 반응 변수의 변화량입니다. 또한 설명 변수의 통계 값은 변경되지 않은 상태이지만 변수 효과의 의미 (설명 변수가 1 단위 씩 증가 할 때 응답 변수의 변화량)가 손실됨을 나타냅니다. 하나, 모형에서 교호 작용을 고려할 때 교호 작용 효과의 표준 오차를 계산할 때 확률 적 척도 조정과 관련된 합병증으로 인해 통계 테스트에도 스케일링이 매우 문제가 될 수 있습니다 (Preacher, 2003). 이러한 이유로, 특히 교호 작용이 관련된 경우 표준 편차 (또는 표준화 / 정규화)에 의한 스케일링은 일반적으로 권장되지 않습니다.
Preacher, KJ, Curran, PJ 및 Bauer, DJ, 2006. 다중 선형 회귀, 다중 레벨 모델링 및 잠재 곡선 분석에서 상호 작용 효과를 조사하기위한 계산 도구. 교육 및 행동 통계 저널, 31 (4), 437-448.