ANOVA는 아니오, 정규 분포 분포 결과 변수를 가정합니다 (다른 것들 중에서도). 고려해야 할 "구식"변형이 있지만 로지스틱 회귀 분석을 선호합니다 (귀하의 경우처럼 독립 변수가 하나만있을 때 카이 제곱과 동일 함). 카이 제곱 검정보다 로지스틱 회귀 분석을 사용하면 전체 검정 (유형 3)에서 유의 한 결과를 발견 할 경우 선형 대비를 사용하여 특정 수준의 처리를 비교할 수 있다는 장점이 있습니다. 예를 들어 A 대 B, B 대 C 등
명확성을 위해 추가 된 업데이트 :
데이터를 가져 와서 ( Allison의 doc 문서 세트 후 ) 변수 cits를 다음과 같이 사용하면 이것이 내 요점입니다.
postdocData$citsBin <- ifelse(postdocData$cits>2, 3, postdocData$cits)
postdocData$citsBin <- as.factor(postdocData$citsBin)
ordered(postdocData$citsBin, levels=c("0", "1", "2", "3"))
contrasts(postdocData$citsBin) <- contr.treatment(4, base=4) # set 4th level as reference
contrasts(postdocData$citsBin)
# 1 2 3
# 0 1 0 0
# 1 0 1 0
# 2 0 0 1
# 3 0 0 0
# fit the univariate logistic regression model
model.1 <- glm(pdoc~citsBin, data=postdocData, family=binomial(link="logit"))
library(car) # John Fox package
car::Anova(model.1, test="LR", type="III") # type 3 analysis (SAS verbiage)
# Response: pdoc
# LR Chisq Df Pr(>Chisq)
# citsBin 1.7977 3 0.6154
chisq.test(table(postdocData$citsBin, postdocData$pdoc))
# X-squared = 1.7957, df = 3, p-value = 0.6159
# then can test differences in levels, such as: contrast cits=0 minus cits=1 = 0
# Ho: Beta_1 - Beta_2 = 0
cVec <- c(0,1,-1,0)
car::linearHypothesis(model.1, cVec, verbose=TRUE)