연속 예측 변수와 관련하여 공선 성이 많지만 범주 형 예측 변수에서는 찾을 수 없습니다. 아래에이 유형의 데이터가 있습니다.
첫 번째 요인은 유전 적 변수 (대립 유전자 수)이고 두 번째 요인은 질병 범주입니다. 분명히 유전자가 질병보다 우선하며 진단으로 이어지는 증상을 나타내는 요인입니다. 그러나 SPSS와 관련하여 일반적으로 수행되는 II 또는 III 제곱합을 사용하는 정기적 인 분석에서는 효과가 없습니다. 제곱의 제곱 유형 분석은 순서에 의존하기 때문에 적절한 순서를 입력 할 때 선택합니다. 또한, II 형 또는 III 형으로 잘 식별되지 않은 유전자와 관련이없는 질병 과정에 추가 성분이있을 수 있습니다 ( 아래의 anova2 (lm1) vs lm2 또는 Anova 참조).
데이터 예 :
set.seed(69)
iv1 <- sample(c(0,1,2), 150, replace=T)
iv2 <- round(iv1 + rnorm(150, 0, 1), 0)
iv2 <- ifelse(iv2<0, 0, iv2)
iv2 <- ifelse(iv2>2, 2, iv2)
dv <- iv2 + rnorm(150, 0, 2)
iv2 <- factor(iv2, labels=c("a", "b", "c"))
df1 <- data.frame(dv, iv1, iv2)
library(car)
chisq.test(table(iv1, iv2)) # quick gene & disease relations
lm1 <- lm(dv~iv1*iv2, df1); lm2 <- lm(dv~iv2*iv1, df1)
anova(lm1); anova(lm2)
Anova(lm1, type="II"); Anova(lm2, type="II")
- 나 에게 유형 I SS를 갖는 lm1 은 배경 이론이 주어진 데이터를 분석하는 적절한 방법으로 보인다. 내 가정이 맞습니까?
- 이러한 문제가 일반적으로 나타나지 않는 직교 설계를 명시 적으로 조작하는 데 익숙합니다. SPSS 중심 필드의 상황에서 이것이 최선의 프로세스 (1 점이 정확하다고 가정)를 검토 자에게 납득시키기 어렵습니까?
- 통계 섹션에서 무엇을보고해야합니까? 추가 분석이나 의견이 있습니까?