최근 논문에서 Norton et al. (2018) [ 1 ] 상태
각 모델마다 다른 임의의 스케일링 계수가 있기 때문에 승산 비 추정을 초래하는 통계 모델이 다른 설명 변수를 갖는 경우 동일한 연구에서 다른 승산 비를 비교할 수 없습니다. 서로 다른 샘플과 모델 사양이 다른 임의의 스케일링 계수를 가지기 때문에 한 연구의 확률 비율의 크기를 다른 연구의 확률 비율의 크기와 비교할 수도 없습니다. 또 다른 의미는 여러 연구에서 주어진 연관의 승산 비의 크기를 메타 분석에서 합성 할 수 없다는 것입니다.
작은 시뮬레이션이 이것을 보여줍니다 (R 코드는 문제의 맨 아래에 있습니다). 실제 모델을 가정하자 :
res_1 res_2 res_3 res_4
1.679768 1.776200 2.002157 2.004077
내 질문 :
- 스터디와 모델에서 승산 비가 기본적으로 비교할 수없는 경우 이진 결과에 대해 다른 스터디의 결과를 어떻게 결합 할 수 있습니까?
- 무엇 수많은 메타 분석에 대해 말할 수있다 않았다 각 연구는 아마도 공변량의 다른 세트 조정 다른 연구에서 교차비를 결합? 그들은 본질적으로 쓸모 없는가?
참고 문헌
[1] : Norton EC, Dowd BE, Maciejewski ML (2018) : 홀수 비율-현재 모범 사례 및 사용. JAMA 320 (1) : 84-85.
[2] : Norton EC, Dowd BE (2017) : 로그 승률 및 로짓 모델 해석. 건강 서비스 해상도 53 (2) : 859-878.
[3] : Hernán MA, Clayton D, Keiding N (2011) : 심슨의 역설이 풀렸다. Int J Epidemiol 40 : 780-785.
폭로
합니다 (R 코드 포함) 문제는 사용자로 인한 질문의 수정 된 버전이다 timdisher 에 datamethods .
R 코드
set.seed(142857)
n_sims <- 1000 # number of simulations
out <- data.frame(
treat_1 = rep(NA, n_sims)
, treat_2 = rep(NA, n_sims)
, treat_3 = rep(NA, n_sims)
, treat_4 = rep(NA, n_sims)
)
n <- 1000 # number of observations in each simulation
coef_sim <- "x1" # Coefficient of interest
# Coefficients (log-odds)
b0 <- 1
b1 <- log(2)
b2 <- log(2.5)
b3 <- log(3)
b4 <- 0
for(i in 1:n_sims){
x1 <- rbinom(n, 1, 0.5)
x2 <- rnorm(n)
x3 <- rnorm(n)
x4 <- rnorm(n)
z <- b0 + b1*x1 + b2*x2 + b3*x3 + b4*x4
pr <- 1/(1 + exp(-z))
y <- rbinom(n, 1, pr)
df <- data.frame(y = y, x1 = x1, x2 = x2, x3 = x3, x4 = x4)
model1 <- glm(y ~ x1, data = df, family = "binomial")
model2 <- glm(y ~ x1 + x2, data = df, family = "binomial")
model3 <- glm(y ~ x1 + x2 + x3, data = df, family = "binomial")
model4 <- glm(y ~ x1 + x2 + x3 + x4, data = df, family = "binomial")
out$treat_1[i] <- model1$coefficients[coef_sim]
out$treat_2[i] <- model2$coefficients[coef_sim]
out$treat_3[i] <- model3$coefficients[coef_sim]
out$treat_4[i] <- model4$coefficients[coef_sim]
}
# Coefficients
colMeans(out)
exp(colMeans(out)) # Odds ratios