세 가지 형태의 "혼합 모델"해석


19

혼합 모델로 나를 혼란스럽게 만드는 차이점이 있으며, 명확성을 얻을 수 있는지 궁금합니다. 카운트 데이터의 혼합 모델이 있다고 가정 해 봅시다. 고정 효과 (A)와 시간 (T)에 대한 또 다른 변수로 원하는 변수가 있습니다 (예 : "사이트"변수).

내가 이해 한대로 :

glmer(counts ~ A + T, data=data, family="Poisson") 고정 효과 모델입니다.

glmer(counts ~ (A + T | Site), data=data, family="Poisson") 랜덤 효과 모델입니다.

내 질문은 다음과 같은 것이있을 때입니다.

glmer(counts ~ A + T + (T | Site), data=data, family="Poisson")T는 무엇입니까? 무작위 효과입니까? 고정 효과? T를 두 곳에 두어 실제로 달성되고있는 것은 무엇입니까?

언제 모델 공식의 랜덤 효과 섹션 에만 무언가가 나타나야합니까?

답변:


22

이 세 가지 모델 각각에 대한 모델 공식을 작성하면 더 명확해질 수 있습니다. 하자 사람에 대한 관찰 할 내가 사이트에서 J 각 모델과 정의 나는 J를 , T I J 유사 모델의 변수를 참조하십시오.와이나는제이나는제이나는제이,나는제이

glmer(counts ~ A + T, data=data, family="Poisson") 모델입니다

로그(이자형(와이나는제이))=β0+β1나는제이+β2나는제이

이것은 단지 일반적인 포아송 회귀 모형입니다.

glmer(counts ~ (A + T|Site), data=data, family="Poisson") 모델입니다

로그(이자형(와이나는제이))=α0+η제이0+η제이1나는제이+η제이2나는제이

여기서 j 사이트의 개인이 각각의 관찰에 의해 공유하는 무작위 효과입니다 . 이 임의의 효과는 지정한 모델에서 자유롭게 상관 될 수 있습니다 (즉, Σ 에 대한 제한이 없음 ). 독립성을 강요하기 위해 다른 괄호 안에 넣어야 합니다. 이 모델은 로그 ( E ( Y i jη제이=(η제이0,η제이1,η제이2)(0,Σ)제이Σ(A-1|Site) + (T-1|Site) + (1|Site) 는모든 사이트에 대해 α 0 이지만 각 사이트에는 임의 오프셋 ( η j 0 )이 있으며 A i j , T i j 와 임의의 선형 관계를 갖습니다.로그(이자형(와이나는제이))α0η제이0나는제이,나는제이

glmer(counts ~ A + T + (T|Site), data=data, family="Poisson") 모델입니다

로그(이자형(와이나는제이))=(θ0+γ제이0)+θ1나는제이+(θ2+γ제이1)나는제이

이제 는 고정 효과 θ 0 , θ 1 , θ 2에 의해 주어진 A i j , T i j 와 "평균"관계를 갖지만 그 관계는 각 사이트마다 다르고 그 차이는 랜덤 효과 γ j 0 , γ j 1 , γ j 2에 의해 포착 됨로그(이자형(와이나는제이))나는제이,나는제이θ0,θ1,θ2γ제이0,γ제이1,γ제이2. 즉, 기준선이 무작위로 이동하고 두 변수의 기울기가 무작위로 이동하고 동일한 사이트의 모든 사람이 동일한 임의의 이동을 공유합니다.

T는 무엇입니까? 무작위 효과입니까? 고정 효과? T를 두 곳에 두어 실제로 달성되고있는 것은 무엇입니까?

는 공변량 중 하나입니다. 임의의 효과가 아닙니다-임의의 효과입니다. 고정 효과가 T 에 의하여 부여 된 임의의 효과에 따라 다르다- γ J 1 위의 모델은. 이것이 임의의 효과를 포함하여 수행하는 관계에있는 위치 사이에 이질성을 허용하는 T 로그 ( E ( Y의 I의 J ) ) .SiteSiteγ제이1로그(이자형(와이나는제이))

언제 모델 공식의 랜덤 효과 섹션에만 무언가가 나타나야합니까?

이것은 응용 프로그램의 맥락에서 의미가있는 문제입니다.

절편과 관련하여 여러 가지 이유로 고정 절편을 유지해야합니다 (예 : 여기 참조 ). re : 랜덤 절편, , 이것은 주로 동일한 위치에서 이루어진 관측치 간의 상관 관계를 유도하는 역할을합니다. 이러한 상관 관계가 존재하지 않는 경우 임의 효과를 제외해야합니다.γ제이0

랜덤 슬로프와 관련하여 랜덤 슬로프 만 있고 고정 슬로프가없는 모델은 각 사이트에 대해 와 각 사이트에 대한 공변량 사이에 어떤 관계가 있지만, 평균을 구하면 모든 사이트에 영향을 주면 관계가 없습니다. 예를 들어 T에 임의의 기울기가 있지만 고정 된 기울기가없는 경우 이는 평균적으로 시간이 영향을 미치지 않지만 (예 : 데이터의 세속적 인 경향이 없음) 각각 시간이 지남에 따라 임의의 방향으로 향하고 있다는 것을 의미합니다. 이해할 수있는 다시 말하지만, 응용 프로그램에 따라 다릅니다.로그(이자형(와이나는제이))Site

랜덤 효과를 사용하거나 사용하지 않고 모델을 적용하여 이러한 상황이 발생하는지 확인할 수 있습니다. 고정 모델에는 영향을 미치지 않지만 후속 모델에는 상당한 임의 효과가 나타납니다. 이와 같은 결정은 모델 선택보다는 애플리케이션에 대한 이해를 바탕으로하는 것이 좋습니다.


2
(+1) : 각 모델에 대한 모델 공식을 작성하는 것이 R- 노테이션을보다 투명하게 만드는 가장 좋은 방법입니다. 잘 했어!
ocram

@ 매크로 위의 방정식에 대한 하나의 질문 (btw에 대한 감사)-또한 일반적인 오류 항이 있습니까? 그렇다면 그 용어의 첨자는 무엇입니까?
Fomite

2
안녕-GLM을 작성하는 한 가지 방법은 이자형(와이나는제이|엑스)내가 한 것처럼 (또는 '링크 된'버전). 모델이 올바르게 지정된 경우 예상 값에 대한 오류 항이 없습니다. GLMS에 우리가 지정하고, 귀하의 질문에 대답하기 위해 유통 의를와이나는제이|엑스. 선형 모형에서 "남은"임의성은 정규 분포 된 오차 항에 의해 나타납니다. 그러나 비선형 GLM (예 : 포아송, 로지스틱)에는 포아송의 비율 또는 베르누이 시행의 성공 확률을 알면 오류없이 실현을 예측할 수 없으므로 임의성이 내장됩니다. 도움이 되었기를 바랍니다.
Macro

11

당신은주의해야한다 T모델의 임의의 효과 측면 중 어느 것도 있지만, 고정 효과가 없습니다. 랜덤 효과는 공식 |에서 뒤에 나오는 효과입니다 lmer!

이 사양이 무엇인지에 대한 자세한 설명은이 질문에 있습니다.

이 질문에서 모델은 (고정 효과에 대해 T) 다음을 제공해야합니다 .

  • 세계적인 경사
  • 각 레벨에 대한 전체 경사와의 편차를 지정하는 임의 경사 용어 Site
  • 랜덤 슬로프 사이의 상관 관계.

그리고 @ mark999가 말했듯이 이것은 실제로 일반적인 사양입니다. 반복 측정 설계에서는 일반적으로 모든 반복 측정 (대상 내) 계수에 대해 임의의 기울기와 상관 관계를 갖기를 원합니다.

몇 가지 예를 보려면 다음 문서를 참조하십시오 (항상 여기 인용하는 경향이 있음).

Judd, CM, Westfall, J., & Kenny, DA (2012). 사회적 심리학에서 자극을 임의의 요소로 취급 : 광범위하지만 무시되는 문제에 대한 새롭고 포괄적 인 솔루션. 성격 및 사회 심리학 저널 , 103 (1), 54–69. 도 : 10.1037 / a0028347


2
생태학에서 비슷한 참조 : Schielzeth, Holger 및 Wolfgang Forstmeier. 2009.“지원 이외의 결론 : 혼합 모델에서 과신 자 추정.”행동 생태학 20 (2) (3 월 1) : 416–420. doi : 10.1093 / beheco / arn145. beheco.oxfordjournals.org/content/20/2/416 .
Ben Bolker

1

매개 변수 자체에 특별히 관심이 없지만 종속 데이터를 피하기 위해 포함 해야하는 경우 임의 부분에만 무언가가 나타납니다. 예를 들어, 자녀가 수업에 중첩 된 경우 일반적으로 자녀를 임의의 효과로 원합니다.


1
어쩌면 나는 당신을 오해하고 있지만, 같은 변수에 대해 고정 효과와 무작위 효과가 무작위 효과가있는 변수보다 더 일반적이라고 생각했을 것입니다. Pinheiro and Bates 책에서 같은 변수에 대해 고정 및 무작위 효과를 갖는 것은 드문 일이 아닙니다.
mark999

2
@MichaelChernick 내가 이해하는 것처럼, 동일한 변수에 대해 고정 효과와 임의 효과가있는 경우 고정 효과는 모집단의 전체 효과이며 무작위 효과는 각 주제에 대해 변수의 다른 효과를 허용합니다. Pinheiro & Bates에는 몇 가지 예가 있습니다.
mark999

2
@PeterFlom, re : "자녀가 수업에 중첩 된 경우 일반적으로 자녀를 임의의 효과로 원합니다." 클래스가 랜덤 효과라는 것을 의미한다고 생각합니다. 데이터에 더 이상의 중첩이 없으면 (예 : 어린이에 대한 반복 측정) 아동 수준의 임의 효과는 식별되지 않습니다.
Macro

1
@macro 예, 그게 제 뜻입니다. 죄송합니다. 용어가 매우 혼란스러워집니다! 이것이 바로 Gelman이 '고정'과 '무작위'라는 용어를 빼앗는 이유 일 수 있습니다.
Peter Flom-Monica Monica

2
@ 마이클, 동의합니다. 이러한 종류의 계층 적 모델에서 랜덤 효과는 그룹화 변수에 의해 정의됩니다 ( '그룹화'변수가 지속적으로 변하는 공간적으로 인덱스 된 데이터 세트와 같은 다른 다변량 모델과 대조). 영업 이익의 질문에, Site임의의 효과,하지로 언급된다 T거나 A또는 다른 것. 그런 식으로 생각하면, 그 Site효과는 명확하지 않고 무작위 일 수 없었습니다. 왜냐하면 둘이 서로 식별되지 않았기 때문입니다. 변수에 대해 고정 계수와 랜덤 계수를 모두 가질 수 있지만 다른 질문입니다.
Macro
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.