내가 아는 한, 로지스틱 모델과 분수 응답 모델 (frm)의 차이점은 frm이 [0,1]이지만 로지스틱이 {0, 1} 인 종속 변수 (Y)입니다. 또한 frm은 유사 가능성 추정기를 사용하여 모수를 결정합니다.
일반적으로로 glm
로지스틱 모델을 얻는 데 사용할 수 있습니다 glm(y ~ x1+x2, data = dat, family = binomial(logit))
.
frm의 경우로 변경 family = binomial(logit)
됩니다 family = quasibinomial(logit)
.
family = binomial(logit)
frm의 매개 변수를 얻을 때도 동일한 추정 값을 얻을 수 있음을 알았습니다 . 다음 예를 참조하십시오
library(foreign)
mydata <- read.dta("k401.dta")
glm.bin <- glm(prate ~ mrate + age + sole + totemp, data = mydata
,family = binomial('logit'))
summary(glm.bin)
반환,
Call:
glm(formula = prate ~ mrate + age + sole + totemp, family = binomial("logit"),
data = mydata)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.1214 -0.1979 0.2059 0.4486 0.9146
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.074e+00 8.869e-02 12.110 < 2e-16 ***
mrate 5.734e-01 9.011e-02 6.364 1.97e-10 ***
age 3.089e-02 5.832e-03 5.297 1.17e-07 ***
sole 3.636e-01 9.491e-02 3.831 0.000128 ***
totemp -5.780e-06 2.207e-06 -2.619 0.008814 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 1166.6 on 4733 degrees of freedom
Residual deviance: 1023.7 on 4729 degrees of freedom
AIC: 1997.6
Number of Fisher Scoring iterations: 6
그리고위한 family = quasibinomial('logit')
,
glm.quasi <- glm(prate ~ mrate + age + sole + totemp, data = mydata
,family = quasibinomial('logit'))
summary(glm.quasi)
반환,
Call:
glm(formula = prate ~ mrate + age + sole + totemp, family = quasibinomial("logit"),
data = mydata)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.1214 -0.1979 0.2059 0.4486 0.9146
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.074e+00 4.788e-02 22.435 < 2e-16 ***
mrate 5.734e-01 4.864e-02 11.789 < 2e-16 ***
age 3.089e-02 3.148e-03 9.814 < 2e-16 ***
sole 3.636e-01 5.123e-02 7.097 1.46e-12 ***
totemp -5.780e-06 1.191e-06 -4.852 1.26e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for quasibinomial family taken to be 0.2913876)
Null deviance: 1166.6 on 4733 degrees of freedom
Residual deviance: 1023.7 on 4729 degrees of freedom
AIC: NA
Number of Fisher Scoring iterations: 6
둘 다의 추정 베타 family
는 동일하지만 그 차이는 SE 값입니다. 그러나 올바른 SE를 얻으려면 library(sandwich)
이 게시물 과 같이 사용해야 합니다.
이제 내 질문 :
- 이 두 코드의 차이점은 무엇입니까?
- frm은 견고한 SE를 얻으려고합니까?
이해가 정확하지 않은 경우 몇 가지 제안을하십시오.