β^0β^
인종 카테고리 (예 : Asian )에 세 번째 레벨을 포함하도록 예제를 약간 확장 하고 White 를 참조로 선택한 경우 다음과 같이됩니다.
- β^0= x¯여H I t E
- β^B l a c k= x¯B l a c k− x¯여H I t E
- β^A는 s의 I에게 N을= x¯A는 s의 I에게 N을− x¯여H I t E
β^
- 엑스¯A는 s의 I에게 N을= β^A는 s의 I에게 N을+ β^0
불행히도 여러 범주 형 변수의 경우 절편에 대한 올바른 해석이 더 이상 명확하지 않습니다 (끝 부분 참고). 각각 여러 수준과 하나의 참조 수준 (예 : 흰색 과 남성) 이있는 n 개의 범주 가있는 경우 가로 채기의 일반적인 형식은 다음과 같습니다.
β^0= ∑엔나는 = 1엑스¯r e fe r e n c e , i− ( n − 1 ) x¯,
엑스¯r e fe r e n c e , i i 번째 범주 형 변수의 참조 수준의 평균입니다.
엑스¯ 전체 데이터 세트의 평균
β^
우리가 당신의 모범으로 돌아 가면, 우리는 다음을 얻을 것입니다.
- β^0= x¯여H I t E+ x¯미디엄L E− x¯
- β^B l a c k= x¯B l a c k− x¯여H I t E
- β^A는 s의 I에게 N을= x¯A는 s의 I에게 N을− x¯여H I t E
- β^에프e m a l e= x¯에프e m a l e− x¯미디엄L E
β^
β^β^0, β ^B l a c k, β ^A는 s의 I에게 N을β^에프e m a l e
수치 예
통조림 수치 예제를 위해 @Gung에서 빌려 드리겠습니다.
d = data.frame(Sex=factor(rep(c("Male","Female"),times=3), levels=c("Male","Female")),
Race =factor(rep(c("White","Black","Asian"),each=2),levels=c("White","Black","Asian")),
y =c(0, 3, 7, 8, 9, 10))
d
# Sex Race y
# 1 Male White 0
# 2 Female White 3
# 3 Male Black 7
# 4 Female Black 8
# 5 Male Asian 9
# 6 Female Asian 10
β^
aggregate(y~1, d, mean)
# y
# 1 6.166667
aggregate(y~Sex, d, mean)
# Sex y
# 1 Male 5.333333
# 2 Female 7.000000
aggregate(y~Race, d, mean)
# Race y
# 1 White 1.5
# 2 Black 7.5
# 3 Asian 9.5
이 숫자를 회귀 결과와 비교할 수 있습니다.
summary(lm(y~Sex+Race, d))
# Coefficients:
# Estimate Std. Error t value Pr(>|t|)
# (Intercept) 0.6667 0.6667 1.000 0.4226
# SexFemale 1.6667 0.6667 2.500 0.1296
# RaceBlack 6.0000 0.8165 7.348 0.0180
# RaceAsian 8.0000 0.8165 9.798 0.0103
β^β^0
β^0= x¯여H I t E+ x¯미디엄L E− x¯
1.5 + 5.333333 - 6.166667
# 0.66666
대비 선택에 대한 참고 사항
β^
β^c o n t r . S U mβ^c o n t r . S U m
- β^c o n t r . S U m0= x¯
- β^c o n t r . S U m나는= x¯나는− x¯
이전 예제로 돌아 가면 다음과 같은 결과가 나타납니다.
- β^c o n t r . S U m0= x¯
- β^c o n t r . S U m여H I t E= x¯여H I t E− x¯
- β^c o n t r . S U mB l a c k= x¯B l a c k− x¯
- β^c o n t r . S U mA는 s의 I에게 N을= x¯A는 s의 I에게 N을− x¯
- β^c o n t r . S U m미디엄L E= x¯미디엄L E− x¯
- β^c o n t r . S U m에프e m a l e= x¯에프e m a l e− x¯
β^c o n t r . S U m