svyglm vs glm에서 가중치 사용


18

가중치의 치료 사이에 차이가 어떻게 알고 싶습니다 svyglmglm

나는 twangR 에서 패키지를 사용하여 다음과 같이 성향 점수를 만든 다음 가중치로 사용합니다 (이 코드는 twang설명서 에서 제공됨).

library(twang)
library(survey)
set.seed(1)

data(lalonde)

ps.lalonde <- ps(treat ~ age + educ + black + hispan + nodegree + married + re74 + re75,
 data = lalonde)

lalonde$w <- get.weights(ps.lalonde, stop.method="es.mean")
design.ps <- svydesign(ids=~1, weights=~w, data=lalonde)

glm1 <- svyglm(re78 ~ treat, design=design.ps)

summary(glm1)

...
Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   6685.2      374.4  17.853   <2e-16 ***
treat         -432.4      753.0  -0.574    0.566    

이것을 다음과 비교하십시오.

glm11 <- glm(re78 ~ treat, weights=w , data=lalonde)
summary(glm11)

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   6685.2      362.5  18.441   <2e-16 ***
treat         -432.4      586.1  -0.738    0.461  

따라서 모수 추정치는 동일하지만 처리에 대한 표준 오차는 상당히 다릅니다.

무게의 치료 사이에 어떤 차이가 있습니까 svyglmglm?

답변:


11

다양한 종류의 가중치가 있으며 혼란스러워집니다. 당신이 생각하는 무게의 종류를 사용하는 다른 기능이나 소프트웨어를 사용할 때 매우 조심해야합니다.

svyglm 함수는 측량 가중치를 사용합니다.이 가중치는 각 케이스가 중요하기 때문에 각 케이스의 중요성을 나타냅니다. glm ()의 무게가 확실하지 않습니다. 측정의 정확도를 나타내는 것 같습니다. (이항식을 사용하는 경우 서로 다른 의미를 갖습니다).

Surveyglm에서 측량 가중치는 올바른 표준 오류를 제공하기 위해 원하는 가중치입니다.

빈도 가중치, 분석 가중치 및 중요도 가중치도 있습니다.


(+1) 감사합니다. 에 대한 문서 이외의 설문 조사 가중치에 대한 액세스 가능한 참조를 알고 surveyglm있습니까?
Joe King


1
참조 주셔서 감사합니다., 접근성에 의해 온라인에서 사용할 수있는 것을 의미했습니다. 죄송합니다. 나는 좋은 도서관에 쉽게 접근 할 수 없다 ....
Joe King

흠 ... 나는 어떤 것을 발견하는 것을 기억하지 않지만, 내가 찾을 수있는 것을 볼 수 있습니다.
Jeremy Miles

9

survey샘플링 가중치에 의해 도입 된 정밀도 손실을 고려하여 표준 오류를 계산합니다. 가중치는 glm간단히 최소 제곱 추정의 오차에 주어진 가중치를 조정하므로 표준 오차가 정확하지 않습니다. Lumley (2010)에서 선택한 내용은 다음과 같습니다.

모델 기반 분석에서는 올바른 표준 오류를 얻기 위해 모델의 임의 부분을 올바르게 지정해야하지만 모든 표준 오류 추정값은 설계 기반이므로 모델에 관계없이 유효합니다. 모델 기반 회귀 분석에 때때로 사용되는 "샌드위치"또는 "모델 견고성"또는 "이분산성 일관성"표준 오류는 우리가 사용할 디자인 기반 표준 오류와 거의 동일합니다. 계층화 처리에있어 가장 큰 차이점은

따라서 설계에 지층이 없으면 사용 sandwich하면 동일하거나 거의 동일한 SE 추정치를 얻을 수 있습니다.

library(sandwich)
coefs <- vcovHC(glm11, type="HC0")
lmtest::coeftest(glm11,coefs)

내 테스트에서는 "HC0"또는 "HC1"을 사용할 때 정확하게 계산하지 않았지만 매우 가까웠습니다. svyglm이제 t- 값 대신 z- 값도보고합니다.


2
미래의 독자에게 도움이된다면 coeftestR 패키지에서 온 것 lmtest입니다.
swihart
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.