귀하의 질문은 양적 및 질적 예측 변수 가 포함 된 회귀 모형의 완벽한 예입니다 . 특히 세 연령대는1 , 2 , &삼 -질적 변수이고, 양적 변수는 쇼핑 습관 과 체중 감량입니다 (상관 관계를 계산하기 때문에 추측하고 있습니다).
모델링 할 데이터가 많기 때문에 오차 추정치 (p- 값 등)가 더 안정적이기 때문에이 방법이 별도의 그룹 별 상관 관계를 계산하는 것보다 훨씬 나은 모델링 방법이라는 점을 강조해야합니다. 더 기술적 인 이유는 회귀 계수의 중요성을 테스트하기 위해 t- 검정 통계량에서 결과 자유도가 높아지기 때문입니다.
규칙에 따라 운영 씨 질적 예측 변수는 c - 1 지표 변수, 두 지표 변수 만 엑스1,엑스2여기에 다음과 같이 정의되어 있어야합니다.
엑스1 개인이 그룹 1에 속하는 경우 = 1 ; 그렇지 않으면 0 입니다 .
엑스2 개인이 그룹 2에 속하는 경우 = 1 ; 그렇지 않으면 0 입니다 .
이것은 그 그룹을 의미합니다 3 로 표현된다 X1=0,X2=0; 귀하의 응답을 나타내는 쇼핑 습관Y 정량 설명 변수 체중 감량 W. 이제이 선형 모형에 적합합니다
E[Y]=β0+β1X1+β2X2+β3W.
명백한 질문은 우리가 변화하더라도 중요합니까
W 과
Y(쇼핑 변수를 응답 변수로 무작위로 선택했기 때문에). 대답은 그렇습니다. 회귀 계수의 추정치는 변경되지만 조건부 그룹 사이의 "연관성"에 대한 검정 (여기서는 t- 검정이지만 단일 예측 변수에 대한 상관 검정과 동일)은 그렇지 않습니다 변화. 명백히
E[Y]=β0+β3W -- for third group,
E[Y]=(β0+β2)+β3W -- for second group,
E[Y]=(β0+β1)+β3W -- for first group,
이것은 도표에 따라 그룹에 따라 3 개의 개별 선을 갖는 것과 같습니다.
Y vs
W. 이는 테스트 대상을 시각화하는 좋은 방법입니다 (기본적으로 EDA 및 모델 검사의 형태이지만 그룹화 된 관측 값을 올바르게 구분해야 함). 세 개의 평행선은 세 그룹간에 상호 작용이 없음을 나타냅니다.
W상호 작용이 많으면 이러한 선이 서로 교차 할 것입니다.
테스트는 어떻게합니까? 기본적으로 일단 모델에 적합하고 추정치를 얻으면 몇 가지 대비를 테스트해야합니다. 특히 당신의 비교를 위해 :
Group 2 vs Group 3: β2+β0−β0=0,
Group 1 vs Group 3: β1+β0−β0=0,
Group 2 vs Group 1: β2+β0−(β0+β1)=0.