lme 및 lmer 비교


30

이 두 기능의 현재 차이점에 대해 누군가가 나를 밝힐 수 있는지 궁금합니다. 다음 질문을 찾았습니다. 혼합 효과 모델에 대해 nlme 또는 lme4 R 라이브러리를 선택하는 방법은 무엇입니까? 하지만 몇 년 전부터 시작되었습니다. 그것은 소프트웨어 분야에서 평생입니다.

내 구체적인 질문은 다음과 같습니다

  • 에 (여전히) 상관 관계 구조가 있습니까 lmelmer처리하지 않습니다는?
  • lmer패널 데이터 에 사용 하는 것이 가능 / 권장 됩니까?

이것들이 다소 기본적이라면 사과드립니다.

좀 더 자세하게 설명하자면, 패널 데이터는 서로 다른 시점에서 같은 개인에 대해 여러 번 측정하는 곳입니다. 나는 일반적으로 몇 년에 걸쳐 반복 / 장기 고객에 대한 데이터를 보유 할 수있는 비즈니스 환경에서 일합니다. 우리는 시간이 지남에 따라 변화를 허용하고 싶지만 매월 또는 매년 더미 변수를 명확하게 맞추는 것은 비효율적입니다. 그러나 lmer이러한 종류의 데이터에 적합한 도구인지 또는 자동 상관 구조가 필요한지 여부 는 확실하지 않습니다 lme.


1
그 대답은 여전히 ​​최신입니다. lmer여전히 다양한 상관 관계 및 분산 구조를 처리하지 못하며 lme상황을 이해하면 결코 그렇지 않을 것입니다.
Aaron-복원 모니카

@Aaron 답장을 보내 주셔서 감사합니다. 두 번째 부분에서는 이것이 lmer패널 데이터 세트를 처리하는 기능에 영향을 줍 니까? 아니면 특정한 상관 관계 가정을하지 않고 도망 갈 수 있습니까?
Hong Ooi

3
@Aaron, 나는 corr / var 구조를 "절대하지 않을 것"에 대해 모른다. 나는이 기능들을 추가하는데 관심이 있고 그것이 그렇게 어렵다고 생각 하지는 않는다. 숨". 패널 데이터에 익숙하지 않아 패널 lmer처리에 필요한 정보를 알 수 없습니다 ... 홍, 필요한 통계적 속성을 좀 더 자세히 설명하거나 포인터를 제공하는 간단한 설명을 질문에 추가 할 수 있습니까?
벤 볼커

@BenBolker 세부 사항을 추가했습니다.
Hong Ooi

4
나는 lmer연도의 임의 효과와 고객의 임의 효과로 꽤 좋을 것이라고 말하고 싶습니다 (연간 고객 당 하나의 측정 만 있다고 가정 해 봅시다). 전체 (고정 효과) 시간 추세에 적합하면 고객 별 임의의 시간 상호 작용 (예 : 임의의 기울기)도 고려해야합니다. 이상적으로는 현재 lmer로는 불가능한 각 고객의 시계열 내에서 시간 자기 상관을 허용하고 싶지만 시간 자기 상관 기능을 검사하여 이것이 중요한지 확인할 수 있습니다.
Ben Bolker

답변:


15

2016 년 6 월 업데이트 :

Ben의 블로그 항목에서이를 달성하는 데 대한 현재의 생각을 설명하십시오 lme4. Braindump 2016 년 6 월 1 일

베이지안 방법을 선호하는 경우 brms패키지의 brm일부 상관 구조를 지원합니다 : CRAN brms page . (특히 참고 : "brms 버전 0.6.0부터 AR 구조는 nlme와 같은 다른 패키지의 이름 지정 및 구현과 일치하는 잔차의 자동 회귀 효과를 나타냅니다. 이전에는 brms의 AR 용어가 응답의 자동 회귀 효과를 나타 냈습니다. 후자는 이제 ARR 효과로 명명되었으며 cor_arma 및 cor_arr 함수에서 인수 r을 사용하여 모델링 할 수 있습니다. ")


원래 답변 2013 년 7 월 :

(의견에서 전환되었습니다.)

나는 lmer연도의 임의 효과와 고객의 임의 효과로 꽤 좋을 것이라고 말하고 싶습니다 (연간 고객 당 하나의 측정 만 있다고 가정 해 봅시다).

lmer(y~1 + (1|year) + (1|customer), ...)

(절편 전용) 모델에 적합

여기서 ϵ 연도

YijNormal(a+ϵyear,i+ϵcustomer,j,σ02)
ϵyear 은 제로 평균 정규 변량에 따라 고유 한 편차가 있습니다.ϵcustomer

이것은 매우 지루한 모델입니다. 전체 (고정 효과) 시간 추세를 추가하고 임의의 시간별 고객 상호 작용 (예 : 임의의 기울기)을 고려할 수 있습니다. 나는 생각한다

lmer(y~year + (1|year) + (year|customer), ...)

모델에 적합해야 함

YijNormal((a+ϵcustomer,j)+(b+ϵyear×customer,j)year+ϵyear,i,σ02)

( year이러한 방식으로 입력 변수를 동일한 모델에 적합 및 랜덤 효과로 포함하지 않는 일반적인 규칙의 예외입니다. 숫자 변수 인 year경우 고정 효과 및 year:customer(임의의) 연속으로 처리됩니다. 무작위 효과에서 상호 작용과 범주로 ...)

물론 연도 별, 고객 수준 및 관측 수준 공변량을 추가하여 관련 차이를 흡수 할 수 있습니다 (예 : 평균 소비자 물가 지수 추가) 연도가 나쁘거나 좋은 이유 ).

이상적으로는 현재로서는 불가능한 각 고객의 시계열 내에서 시간 자기 상관을 허용하고 싶지만 lmer시간 자기 상관 기능을 검사하여 중요한지 여부를 확인할 수 있습니다 ...

주의 사항 : 나는 패널 데이터를 처리하기위한 표준 접근법에 대해 많이 모른다. 이것은 혼합 모델에 대한 나의 지식에 근거합니다. 주석가 (또는 편집자)가 계량 경제학의 표준 / 모범 사례를 위반하는 것 같으면 자유롭게 차임해야합니다.


XN(μ,σ2) means the marginal distribution of X is normal with mean μ and variance σ2 - I think your equations are not quite right. What you've written are conditional distributions, given the random effects. The marginal distribution of Yij in the first model is
N(a,σ02+σyear2+σcust2)
In the second model the marginal mean is a+byear and the variance is a more complicated expression involving the covariance between the year random slope/intercept plus the other stuff.
Macro

Yep, thanks Ben. In practice there would be fixed effects as well, eg age, sex and all the usual suspects. @Macro: Ben has it right, I believe.
Hong Ooi

@Macro: I think the notation is odd/unusual, but correct (i.e. equivalent to what you suggest.) I've expressed the random effect terms as part of μ. It would probably be clearer/more familiar if I wrote it out in multilevel notation (YNormal(Xβ+Zu,σ2);uMVNormal(0,Σ);Σ=f(θ)).
Ben Bolker


2
I've just posted some stuff I've been working on recently at rawgit.com/bbolker/mixedmodels-misc/master/notes/… ; I'll try to get around to incorporating relevant bits in my answer (alternatively, anyone else is welcome to either post their own answer based on that information, or edit my qestion!)
Ben Bolker

3

To answer your questions directly, and NB this is years after the original post!

  • Yep there are still correlation structures that nlme handles which lme4 will not handle. However, for as long as nlme allows the user to define general corstrs and lme4 does not, this will be the case. This has surprisingly little practical impact. The "big three" correlation structures of: Independent, Exchangeable, and AR-1 correlation structures are easy handled by both packages.

  • It's certainly possible. You can fit panel data with the lm function too! My recommendation about which to use depends on the problem. lme4 is a much smaller tool kit, and the formula representation is a neat, concise way of depicting some very common mixed effects models. nlme is the very large tool box, including a TIG welder to make any tools you need.

You say you want to allow for "variation over time". Essentially, an exchangeable correlation structure achieves this, allowing for a random intercept in each cluster, so that the intracluster variance is the sum of cluster level variation as well as (what you call) variation over time. And this by no means deters you from using fixed effects to obtain more precise predictions over time.


1
Hmm. How can one use AR-1 correlation in lme4?
amoeba says Reinstate Monica
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.