혼합 모델에서 단일 맞춤 처리


16

모델이 있다고 가정 해 봅시다.

mod <- Y ~ X*Condition + (X*Condition|subject)

# Y = logit variable  
# X = continuous variable  
# Condition = values A and B, dummy coded; the design is repeated 
#             so all participants go through both Conditions  
# subject = random effects for different subjects 

summary(model)
Random effects:
 Groups  Name             Variance Std.Dev. Corr             
 subject (Intercept)      0.85052  0.9222                    
         X                0.08427  0.2903   -1.00            
         ConditionB       0.54367  0.7373   -0.37  0.37      
         X:ConditionB     0.14812  0.3849    0.26 -0.26 -0.56
Number of obs: 39401, groups:  subject, 219

Fixed effects:
                 Estimate Std. Error z value Pr(>|z|)    
(Intercept)       2.49686    0.06909   36.14  < 2e-16 ***
X                -1.03854    0.03812  -27.24  < 2e-16 ***
ConditionB       -0.19707    0.06382   -3.09  0.00202 ** 
X:ConditionB      0.22809    0.05356    4.26 2.06e-05 ***

여기서 우리는 절편과 x의 랜덤 효과 사이의 상관 관계가 -1이기 때문에 단일 적합을 관찰합니다. 이제이 유용한 링크 에 따르면 이 모델을 처리하는 한 가지 방법은 고차 무작위 효과 (예 : X : ConditionB)를 제거하고 특이성을 테스트 할 때 차이가 있는지 확인하는 것입니다. 다른 하나는 blme특이성을 피하기 위해 패키지 와 같은 베이지안 접근법을 사용하는 것 입니다.

선호하는 방법은 무엇이며 왜 그렇습니까?

첫 번째 또는 두 번째 결과를 사용하면 다른 결과가 발생하기 때문에 이것을 묻습니다. 첫 번째 경우 X : ConditionB 임의 효과를 제거하고 X와 X : ConditionB 임의 효과 간의 상관 관계를 추정 할 수 없습니다. 반면에를 사용 blme하면 X : ConditionB를 유지하고 주어진 상관 관계를 추정 할 수 있습니다. 베이지안 접근법을 사용하여 모든 것을 추정 할 수있을 때 특이 값이 발생할 때 비 베이지안 추정을 사용해야하고 임의의 효과를 제거해야하는 이유는 없습니다.

누군가 단일 피팅을 처리하는 두 가지 방법을 사용하여 이점과 문제를 설명 할 수 있습니까?

감사합니다.


corr = -1에 대해 무엇을 걱정합니까? 임의 효과 사이의 상관 관계입니다.
user158565

따라서 각 피험자는 조건 A와 조건 B에서 각각 두 가지 Y 측정을 제공합니까? 그것이 사실이라면, 조건 A와 B 사이에서 주어진 주제에 대해 연속 변수 X의 값이 변하는 지 여부를 알려줄 수 있습니까?
Isabella Ghement

랜덤 효과에 Condition을 넣는 이유는 무엇입니까? 필요한지 테스트 했습니까?
Dimitris Rizopoulos 5

@ user158565 예, 그러나 특이점을 나타냅니다 ...
User33268

트윗 담아 가기 예, 그렇습니다. x는 A와 B 사이의 주어진 주제에 대해 변합니다. 또한 X에 대한 Y의 회귀가 모든 주제에 대해 다르다고 가정하는 이론적 이유가 있습니다.
User33268

답변:


21

단일 피팅을 얻을 때, 이는 종종 모델이 과적 합되었음을 나타냅니다. 즉, 랜덤 효과 구조가 너무 복잡하여 데이터가 지원할 수 없으므로 임의 효과의 가장 복잡한 부분을 제거하기위한 조언으로 이어집니다. 구조 (보통 임의의 경사). 이 접근 방식의 장점은 지나치게 적합하지 않은보다 포용적인 모델로 이어진다는 것입니다.

그러나 아무것도하기 전에, 당신이 원하는에 대한 좋은 이유가 있습니까 X, Condition모두가 처음부터 대상에 따라 다양하고, 상호 작용? 데이터가 어떻게 생성되는지에 대한 이론이 이것을 제안합니까?

최대 랜덤 효과 구조를 사용하여 모형을 적합시키고 lme4단일 적합치를 얻으려면 베이지안 프레임 워크에 동일한 모형을 적합하게하면 추적 도표를 검사하고 다양한 모수 추정값이 얼마나 잘 수렴되는지를 통해 문제가 발생한 이유 수 있습니다. lme4. 베이지안 접근 방식의 장점은 원래 모델의 문제를 발견 할 수 있다는 것입니다. 최대 랜덤 효과 구조가 데이터에 의해 지원되지 않는 이유) 또는 lme4모델에 적합하지 않은 이유를 발견 할 수 있습니다 . 유익한 사전 정보가 사용되지 않는 한 베이지안 모델이 제대로 수렴되지 않는 상황이 발생했습니다.

요컨대, 두 가지 접근법 모두 장점이 있습니다.

그러나 나는 항상 초기 모델이 포용 적이며 전문가 도메인 지식에 의해 가장 적절한 랜덤 효과 구조를 결정하기 위해 정보를 얻는 곳에서 시작합니다. 그룹화 변수를 지정하는 것은 비교적 간단하지만 임의의 슬로프는 일반적으로하지 않습니다 포함되어야한다. 이론적으로 합리적이고 데이터에 의해 뒷받침되는 경우에만 포함하십시오.

편집 : 의견에 최대 랜덤 효과 구조에 맞는 이론적 인 이유가 있다고 언급되어 있습니다. 그래서, 동등한 베이지안 모델을 진행하는 비교적 쉬운 방법으로 전화를 교환하는 것입니다 glmerstan_glmer로부터 rstanarm패키지 - 플러그 앤 플레이를 할 수 있도록 설계되어있다. 기본 우선 순위가 있으므로 모델을 빠르게 맞출 수 있습니다. 패키지에는 수렴을 평가하기위한 많은 도구가 있습니다. 모든 매개 변수가 그럴듯한 값으로 수렴되는 것을 발견하면 모두 좋습니다. 그러나 여러 가지 문제가있을 수 있습니다. 예를 들어 분산이 0 이하로 추정되거나 추정이 계속 변동합니다. mc-stan.org 사이트에는 풍부한 정보와 사용자 포럼이 있습니다.


1
그렇습니다. 저는 X에서 Y의 회귀가 조건 A와 B에 따라 과목마다 다르게 달라져야한다는 이론적 인 이유가 있습니다. 회귀는 처리 스타일을 의미합니다. 특이점의 진단 도구로 트레이스 플롯을 해석하는 방법에 대한 추가 정보를 제공 할 수 있습니까?
33268

11

이것은 흥미로운 답변과 의견을 가진 매우 흥미로운 스레드입니다! 이것이 아직 제기되지 않았기 때문에 각 주제에 대한 데이터가 거의 없다는 것을 알고 싶었습니다. 실제로 각 주제에는 응답 변수 Y, 범주 형 변수 조건 및 연속 변수 X 각각에 대해 두 개의 값만 있습니다. 특히, 조건의 두 값이 A와 B라는 것을 알고 있습니다.

혼합 효과 모델링 대신 2 단계 회귀 모델링을 수행하려는 경우 아래 장난감 예제에서 대상 중 하나에 대해 설명 된 것처럼 선형 회귀 모델을 특정 주제의 데이터에 맞출 수도 없었습니다.

y <- c(4, 7)
condition <- c("A", "B")
condition <- factor(condition)
x <- c(0.2, 0.4)

m <- lm(y ~ condition*x)
summary(m)

이 주제별 모델의 출력은 다음과 같습니다.

Call:
lm(formula = y ~ condition * x)

Residuals:
ALL 2 residuals are 0: no residual degrees of freedom!

Coefficients: (2 not defined because of singularities)
         Estimate Std. Error t value Pr(>|t|)
(Intercept)         4         NA      NA       NA
conditionB          3         NA      NA       NA
x                  NA         NA      NA       NA
conditionB:x       NA         NA      NA       NA

Residual standard error: NaN on 0 degrees of freedom
Multiple R-squared:      1,     Adjusted R-squared:    NaN 
F-statistic:   NaN on 1 and 0 DF,  p-value: NA

단 2 개의 관측 값을 사용하여 4 개의 회귀 계수와 오차 표준 편차를 추정하려고 시도함에 따라 모형 적합도 특이점을 겪게됩니다.

각 조건에서이 주제를 한 번이 아니라 두 번 관찰하더라도 특이점이 지속됩니다. 그러나 각 조건에서 주제를 3 번 ​​관찰하면 특이점을 제거 할 수 있습니다.

y <- c(4, 7, 3, 5, 1, 2)
condition <- c("A", "B", "A","B","A","B")
condition <- factor(condition)
x <- c(0.2, 0.4, 0.1, 0.3, 0.3, 0.5)

m2 <- lm(y ~ condition*x)
summary(m2)

특이점이 사라진이 두 번째 예에 해당하는 R 출력은 다음과 같습니다.

>     summary(m2)

Call:
lm(formula = y ~ condition * x)

Residuals:
    1       2       3       4       5       6 
1.3333  2.3333 -0.6667 -1.1667 -0.6667 -1.1667 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)
(Intercept)     4.667      3.555   1.313    0.320
conditionB      6.000      7.601   0.789    0.513
x             -10.000     16.457  -0.608    0.605
conditionB:x   -5.000     23.274  -0.215    0.850

Residual standard error: 2.327 on 2 degrees of freedom
Multiple R-squared:  0.5357,    Adjusted R-squared:  -0.1607 
F-statistic: 0.7692 on 3 and 2 DF,  p-value: 0.6079

물론, 혼합 효과 모델은 각 주제에 대해 관련이없는 별도의 선형 회귀 모델에 적합하지 않습니다. 이는 인터셉트 및 / 또는 슬로프가 일반적인 인터셉트 및 / 또는 슬로프에 대해 무작위로 벗어난 "관련된"모델에 적합합니다. 일반적인 절편 및 / 또는 일반적인 기울기는 평균이 0이고 표준 편차가 알려지지 않은 정규 분포를 따릅니다.

그럼에도 불구하고, 내 직감은 혼합 효과 모델이 각 주제에 대해 2 개의 작은 관찰로 어려움을 겪고 있다고 제안합니다. 모델에 랜덤 슬로프가 많을수록 더 힘들어집니다. 각 피험자가 2 개 (즉, 조건 당 3 개) 대신 6 개의 관측치에 기여한 경우 더 이상 모든 임의의 경사를 수용하는 데 어려움이 없을 것입니다.

현재 연구 설계가 복잡한 모델링 야망을 지원하지 않는 경우 (?)가 될 수있는 것처럼 보입니다. 그 야망을 지원하기 위해서는 각 주제에 대해 각 조건 (또는 적어도 일부 과목?). 이것은 단지 직관 일 뿐이므로 다른 사람들이 내 관찰에 대한 통찰력을 추가 할 수 있기를 바랍니다. 미리 감사드립니다!


나는 당신을 수정해야합니다-각 참가자는 A와 B 조건에서 X와 Y 모두에 대해 30 개의 관찰을합니다!
33268

2
아, 그것은 당신의 초기 답변에 표시되지 않았으므로 당신이 실제로 가진 주제와 상태 당 얼마나 많은 관측치를 추측하는 것이 불가능했을 것입니다. 그때 다른 일이 있습니다. X 변수를 표준화하려고 했습니까? 이것이 lme에 도움이됩니까? 또한 각 과목에 대해 조건 = A 대 조건 = B에 대해 Y 대 X (또는 표준화 된 X)의 도표를 보았습니까? 그것은 당신에게 무슨 일이 일어나고 있는지에 대한 추가 단서를 줄 수 있습니다.
Isabella Ghement

반응 시간 데이터이기 때문에 x를 표준화하지 않았으며 회귀 계수의 해석에 중요합니다. 그러나 데이터는 중앙 집중식이었습니다. 개별 음모를 살펴보고 다음을 참조하십시오.
User33268

2
@ User33268 나는 파티에 조금 늦었지만 여전히 표준화 된 계수를 해석 할 수 있습니다. 모델을 실행 한 후에 스케일링에 사용 된 값을 저장 한 다음 역변환해야합니다.
Frans Rodenburg
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.