나는 회귀가 더 일반적인 형태의 분산 분석이고 결과가 동일하다는 인상을 항상 받았다. 그러나 최근에 동일한 데이터에 대해 회귀 분석과 분산 분석을 모두 실행했으며 결과가 크게 다릅니다. 즉, 회귀 모형에서는 주 효과와 교호 작용이 모두 중요하지만 분산 분석에서는 주 효과가 중요하지 않습니다. 나는 이것이 상호 작용과 관련이 있다고 생각하지만 동일한 질문을 모델링하는이 두 가지 방법에 대해 다른 점이 분명하지 않습니다. 중요한 경우 아래의 시뮬레이션에 표시된대로 한 예측 변수는 범주 형이고 다른 예측 변수는 연속적입니다.
다음은 내 데이터의 모양과 실행중인 분석의 예이지만 결과에서 동일한 p- 값 또는 효과가 중요하지 않습니다 (실제 결과는 위에 요약되어 있음).
group<-c(1,1,1,0,0,0)
moderator<-c(1,2,3,4,5,6)
score<-c(6,3,8,5,7,4)
summary(lm(score~group*moderator))
summary(aov(score~group*moderator))
group
숫자 형 벡터입니까, 이것은 의도적 인 것입니까? 일반적으로 그룹화 요소에는 클래스가 있어야 factor
하므로 대비로의 변환은와 같은 함수에 의해 자동으로 처리 될 수 있습니다 lm()
. 그룹이 두 개 이상이면 group
변수 가 명확하지 않게되거나 0/1 이외의 코딩을 사용 합니다.