R의 lmer 치트 시트


160

이 포럼에서를 사용하여 다양한 계층 적 모델을 지정하는 올바른 방법에 대한 많은 토론이 lmer있습니다.

한 곳에서 모든 정보를 얻는 것이 좋을 것이라고 생각했습니다. 시작해야 할 몇 가지 질문 :

  1. 어떻게 한 그룹이 다른 내에 중첩되는 여러 수준을 지정합니다 : 그 것이다 (1|group1:group2)(1+group1|group2)?
  2. 차이 무엇 (~1 + ....)(1 | ...)(0 | ...)등?
  3. 그룹 수준의 상호 작용을 지정하는 방법은 무엇입니까?

11
수동 과 세 네트 lme4패키지가 될 수 CRAN에서 발견
헨리

4
CRAN 자료 이외에도 Doug가 r-forge 에서 제공 하는 lme4로 (G) LMM 및 R에 관한 강의 슬라이드와 초안 장이 있습니다.
Gavin Simpson

Bates et al .: lme4를 사용하여 선형 혼합 효과 모델 피팅 (특히 2.2 "혼합 모델 공식 이해")에 의한 JSX 논문의 arXiv 버전에 대한 직접 링크 . Ben Bolker의 FAQ 관련 섹션 도 참조하십시오 .
amoeba

5
논쟁의 여지가 있지만, 사용되는 언어 lmer는 일반적인 통계적 관심사이므로 프로그래밍의 문제 만이 아닙니다. 따라서이 스레드를 계속 열어두기로 투표하고 있습니다.
whuber

2
@whuber +1 완전히 동의합니다.
amoeba

답변:


180

(~ 1 + ....)와 (1 | ...)과 (0 | ...)의 차이점은 무엇입니까?

랜덤 효과로 취급되는 범주 형 변수 V2와 선형 고정 효과로 취급되는 연속 변수 V3에 의해 예측 된 변수 V1이 있다고 가정하십시오. lmer 구문을 사용하면 가장 간단한 모델 (M1)은 다음과 같습니다.

V1 ~ (1|V2) + V3

이 모델은 다음을 추정합니다.

P1 : 전역 차단

P2 : V2에 대한 랜덤 효과 차단 (즉, V2의 각 레벨에 대해 해당 레벨의 인터셉트의 전역 인터셉트 편차)

P3 : V3의 효과 (기울기)에 대한 단일 전역 추정치

다음으로 가장 복잡한 모델 (M2)은 다음과 같습니다.

V1 ~ (1|V2) + V3 + (0+V3|V2)

이 모델은 M1의 모든 매개 변수를 추정하지만 추가로 추정합니다.

P4 : V2의 각 레벨 내에서 V3의 효과 (보다 구체적으로, 주어진 레벨 내에서 V3 효과가 V3의 전체 효과에서 벗어난 정도)와 레벨 간 인터셉트 편차와 V3 효과 편차 사이에 제로 상관 관계 V2의 .

후자의 제한은 가장 복잡한 최종 모델 (M3)에서 완화됩니다.

V1 ~ (1+V3|V2) + V3

여기서 V2 레벨 내에서 절편 편차와 V3 효과 편차 사이의 상관을 허용하면서 M2의 모든 매개 변수가 추정됩니다. 따라서 M3에서는 추가 매개 변수가 추정됩니다.

P5 : V2 레벨에서 절편 편차와 V3 편차 간의 상관 관계

일반적으로 M2 및 M3과 같은 모델 쌍을 계산하여 고정 효과 (전역 차단 포함) 간의 상관 관계에 대한 증거를 평가합니다.

이제 다른 고정 효과 예측 변수 인 V4를 추가해보십시오. 모델:

V1 ~ (1+V3*V4|V2) + V3*V4

추정 :

P1 : 전역 차단

P2 : V3의 효과에 대한 단일 글로벌 추정치

P3 : V4의 효과에 대한 단일 글로벌 추정치

P4 : V3과 V4 간의 상호 작용에 대한 단일 글로벌 추정

P5 : V2의 각 수준 에서 P1 의 절편 편차

P6 : V2의 각 레벨 에서 P2 의 V3 효과 편차

P7 : V2의 각 수준 에서 P3 의 V4 효과 편차

P8 : V2의 각 수준 에서 P4 와의 V3-by-V4 상호 작용 편차

V2 레벨에서 P5P6의 P9 상관

V2 레벨에서 P5P7 사이의 P10 상관

V2 레벨에서 P5P8의 P11 상관

V2 레벨에서 P6P7 간의 P12 상관

P13의 상관 관계 P6P8 V2의 수준에서

V2 레벨에서 P7P8의 P14 상관

, 그것은 많은 매개 변수입니다! 그리고 모델에 의해 추정 된 분산 파라미터를 나열하지도 않았습니다. 또한 고정 효과로 모델링하려는 수준이 2 개 이상인 범주 형 변수가있는 경우 해당 변수에 대한 단일 효과 대신 항상 k-1 효과를 추정하게됩니다 (여기서 k는 레벨 수임) 이에 의해, 모델에 의해 추정 될 파라미터의 수를 더욱 더 폭발시킨다.


1
@Mike Lawrence 답변 주셔서 감사합니다! 그러면 3 단계 모델은 어떻게 추정됩니까? 한 그룹화 요소가 다른 그룹화 요소 안에 중첩되어 있습니까?

DBR, 나는 당신이 어떤 수준인지 알지 못한다고 생각합니다. 당신은 이것에 대해 영원히 묻고 있습니다. 실제로 실험 설계를 자세히 설명하고 "수준"에 대한 해석을 보여주는 질문을 작성하십시오.
John

3
DBR이 계층 구조의 레벨을 참조한다고 생각합니다. 내가 설명 한 것은 주제 내에 중첩 된 관측치가있는 2 레벨 계층 모델이며 DBR은 3 레벨 계층에 대해 묻습니다.이 예제는 학생과 학교 모두를 무작위로 모델링하려는 학교 내 학생 내의 테스트 항목 일 수 있습니다 학생들이 학교에 내포되어있는 효과. 그러한 경우에 나는 학교 수준의 편차가 먼저 학교에서 벗어난 것으로 계산된다고 가정합니다.
마이크 로렌스

2
모델 설정을 위해 본 최고의 답변입니다. 내가 상사에게 내가 lmer와 함께 R에서하고있는 일을 이해할 수있는 쉬운 프레임 워크를 제공하는 데 도움이되었다.
bfoste01

와이나는제이=γ00+γ10엑스나는제이+γ01제이+γ11엑스나는제이제이+1제이엑스나는제이+0제이+이자형나는제이
나는나는제이제이lmerY~X+Z+(1|group)+(0+X|Z)group

50

다른 대답 에서 언급했듯이 일반적인 트릭은 수식이 형식을 따르는 것 dependent ~ independent | grouping입니다. 이는 grouping일반적으로 임의 요인이므로 그룹화없이 고정 요인을 포함 할 수 있으며 고정 요인없이 절편 전용 모델 인 추가 임의 요인을 가질 수 있습니다. +요소 사이는이 상호 작용을 나타냅니다 *상호 작용을 나타냅니다.

임의의 요인에 대해 세 가지 기본 변형이 있습니다.

  1. 랜덤 팩터로만 가로 채기 : (1 | random.factor)
  2. 임의의 요인으로 만 기울기 : (0 + fixed.factor | random.factor)
  3. 랜덤 팩터에 의한 절편 및 경사 : (1 + fixed.factor | random.factor)

변형 3은 기울기와 절편이 같은 그룹으로, 즉 동시에 계산됩니다. 기울기와 절편이 독립적으로 계산되기를 원한다면 (즉, 둘 사이의 상관 관계가없는 경우) 네 번째 변형이 필요합니다.

  • 임의의 요인에 의해 개별적으로 절편 및 기울기 : (1 | random.factor) + (0 + fixed.factor | random.factor). 이것을 쓰는 다른 방법은 이중 막대 표기법을 사용하는 것 fixed.factor + (fixed.factor || random.factor)입니다.

도 있습니다 좋은 요약 하면 보라이 질문에 다른 응답은.

수학에 조금이라도 관심이 있다면 Barr et al. (2013)은 lmer테이블리스 마크 다운의 제약 조건을 충족시키기 위해 여기에 적용된 구문을 표 1에 아주 잘 요약합니다 . 이 논문은 심리 언어 학적 데이터를 다루었으므로 두 가지 임의의 효과는 SubjectItem입니다.

모델 및 동등한 lme4수식 구문 :

    • 와이에스나는=β0+β1엑스나는+이자형에스나는
    • 해당 없음 (혼합 효과 모델이 아님)
    • 와이에스나는=β0+에스0에스+β1엑스나는+이자형에스나는
    • Y ∼ X+(1∣Subject)
    • 와이에스나는=β0+에스0에스+(β1+에스1에스)엑스나는+이자형에스나는
    • Y ∼ X+(1 + X∣Subject)
    • 와이에스나는=β0+에스0에스+나는0나는+(β1+에스1에스)엑스나는+이자형에스나는
    • Y ∼ X+(1 + X∣Subject)+(1∣Item)
    • 와이에스나는=β0+에스0에스+나는0나는+β1엑스나는+이자형에스나는
    • Y ∼ X+(1∣Subject)+(1∣Item)
    • 에스0에스에스1에스
    • Y ∼ X+(1∣Subject)+(0 + X∣ Subject)+(1∣Item)
    • 와이에스나는=β0+나는0나는+(β1+에스1에스)엑스나는+이자형에스나는
    • Y ∼ X+(0 + X∣Subject)+(1∣Item)

참고 문헌 :

Barr, Dale J, R. Levy, C. Scheepers und HJ Tily (2013). 확증 가설 검정을위한 랜덤 효과 구조 : 최대로 유지하십시오 . 메모리 및 언어 저널, 68 : 255-278.


4
좋은. 중첩 된 '/'요소 및 이중 막대 표기법 '||'에 대한 정보가 더 좋을 수 있습니다.
skan

1
: 기호는 어떻습니까?
eastafri

1
@eastafri 그것은 R (공식)의 모든 곳에서 똑같은 일을 의미합니다-두 변수 사이의 상호 작용.
Livius

에스0에스에스1에스0에스0에스에스1에스

4

|기호는 혼합 방법에 그룹화 요소를 나타냅니다.

Pinheiro & Bates에 따라 :

... 공식은 또한 반응 과 가능한 경우 1 차 공변량을 지정 합니다. 그것은 다음과 같이 주어진다

response ~ primary | grouping

여기서 response반응에 primary대한 표현식이고 1 차 공변량에 grouping대한 표현식이며 그룹화 요인에 대한 표현식입니다.

에서 혼합 분석법 분석을 수행하는 데 사용하는 방법에 따라 분석에서 그룹화를 사용할 수 있도록 개체를 R만들어야 할 수도 있습니다 groupedData(자세한 내용은 nlme패키지 참조 lme4). lmer데이터를 모르기 때문에 모델 명세서를 지정한 방식으로 말할 수 없습니다 . 그러나 (1|foo)모델 라인에 여러 개가있는 것은 내가 본 것과는 다릅니다. 당신은 무엇을 모델링하려고합니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.