응답자가 네 그룹 중 하나에 무작위로 할당 된 설문 조사 실험의 데이터가 있습니다.
> summary(df$Group)
Control Treatment1 Treatment2 Treatment3
59 63 62 66
세 가지 치료 그룹은 적용되는 자극이 약간 다르지만, 내가 관심을 갖는 주요 차이점은 대조군과 치료 그룹 사이에 있습니다. 그래서 더미 변수를 정의했습니다 Control
.
> summary(df$Control)
TRUE FALSE
59 191
설문 조사에서 응답자들은 다른 두 가지 중에서 선호하는 두 가지 중 하나를 선택하도록 요청했습니다.
> summary(df$Prefer)
A B NA's
152 93 5
그런 다음 치료 그룹에 의해 결정된 자극을 받고 (대조군에 속해 있지 않은 경우) 자극을받은 후 응답자에게 동일한 두 가지 중에서 선택하도록 요청했습니다.
> summary(df$Choice)
A B
149 101
나는 세 가지 치료 그룹 중 하나에있는 존재가이 마지막 질문에서 응답자가 선택한 선택에 영향을 미쳤는지 알고 싶습니다. 내 가설은 치료를받은 응답자가보다 더 선택할 가능성이 높다는 A
것 B
입니다.
범주 형 데이터로 작업 중이므로 로짓 회귀 분석을 사용하기로 결정했습니다 (정확하지 않다고 생각되면 자유롭게 들리십시오). 응답자가 무작위로 할당되었으므로 다른 변수 (예 : 인구 통계)를 제어 할 필요가 없다는 인상을 받고 있으므로이 질문에 대해서는 제외했습니다. 첫 번째 모델은 다음과 같습니다.
> x0 <- glm(Product ~ Control + Prefer, data=df, family=binomial(link="logit"))
> summary(x0)
Call:
glm(formula = Choice ~ Control + Prefer, family = binomial(link = "logit"),
data = df)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.8366 -0.5850 -0.5850 0.7663 1.9235
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.4819 0.3829 3.871 0.000109 ***
ControlFALSE -0.4068 0.3760 -1.082 0.279224
PreferA -2.7538 0.3269 -8.424 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 328.95 on 244 degrees of freedom
Residual deviance: 239.69 on 242 degrees of freedom
(5 observations deleted due to missingness)
AIC: 245.69
Number of Fisher Scoring iterations: 4
나는 통계적으로 중요한 절편이 해석 가능한 의미를 갖는 것이 아니라는 인상을 받고있다. 아마도 다음과 같이 상호 작용 용어를 포함시켜야한다고 생각했습니다.
> x1 <- glm(Choice ~ Control + Prefer + Control:Prefer, data=df, family=binomial(link="logit"))
> summary(x1)
Call:
glm(formula = Product ~ Control + Prefer + Control:Prefer, family = binomial(link = "logit"),
data = df)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.5211 -0.6424 -0.5003 0.8519 2.0688
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 3.135 1.021 3.070 0.00214 **
ControlFALSE -2.309 1.054 -2.190 0.02853 *
PreferA -5.150 1.152 -4.472 7.75e-06 ***
ControlFALSE:PreferA 2.850 1.204 2.367 0.01795 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 328.95 on 244 degrees of freedom
Residual deviance: 231.27 on 241 degrees of freedom
(5 observations deleted due to missingness)
AIC: 239.27
Number of Fisher Scoring iterations: 5
이제 치료 그룹에서와 같이 응답자 상태가 예상되는 영향을 미칩니다. 이 단계가 유효한 단계입니까? 상호 작용 항을 ControlFALSE:PreferA
어떻게 해석 할 수 있습니까? 다른 계수는 여전히 로그 확률입니까?