추가적인 중첩 구조를 갖는 반복 측정 데이터에 대해 R로 선형 혼합 모델을 지정하는 것에 대한 질문


10

데이터 구조

> str(data)
 'data.frame':   6138 obs. of  10 variables:
 $ RT     : int  484 391 422 516 563 531 406 500 516 578 ...
 $ ASCORE : num  5.1 4 3.8 2.6 2.7 6.5 4.9 2.9 2.6 7.2 ...
 $ HSCORE : num  6 2.1 7.9 1 6.9 8.9 8.2 3.6 1.7 8.6 ...
 $ MVMNT  : Factor w/ 2 levels "_Withd","Appr": 2 2 1 1 2 1 2 1 1 2 ...
 $ STIM   : Factor w/ 123 levels " arti"," cele",..: 16 23 82 42 105 4 93 9 34 25 ...
 $ DRUG   : Factor w/ 2 levels "Inactive","Pharm": 1 1 1 1 1 1 1 1 1 1 ...
 $ FULLNSS: Factor w/ 2 levels "Fasted","Fed": 2 2 2 2 2 2 2 2 2 2 ...
 $ PATIENT: Factor w/ 25 levels "Subj01","Subj02",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ SESSION: Factor w/ 4 levels "Sess1","Sess2",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ TRIAL  : Factor w/ 6138 levels "T0001","T0002",..: 1 2 3 4 5 6 7 8 9 10 ...

풀 모델 후보

model.loaded.fit <- lmer(RT ~ ASCORE*HSCORE*MVMNT*DRUG*FULLNSS
                              + (1|PATIENT) + (1|SESSION), data, REML = TRUE)
  • 시험의 반응 시간은 세션 내에서 클러스터링되며, 그 결과 환자 내에서 클러스터링됩니다.
  • 각 시도는 ASCORE와 HSCORE의 2 개의 연속 공변량 (1-9 사이)과 이동 응답 (철회 또는 접근)으로 특징 지을 수 있습니다.
  • 세션은 약물 섭취 (위약 또는 활성 약학) 및 충만 (금식 또는 사전 급식)을 특징으로합니다.

모델링과 R 구문?

하향식 모델 선택 전략의 시작점으로 사용할 수있는로드 평균 구조 로 적절한 전체 모델 을 지정하려고합니다 .

특정 문제 :

  • 구문이 클러스터링 및 임의 효과를 올바르게 지정합니까?
  • 구문을 넘어서이 모델이 위의 주제 내 디자인에 적합합니까?
  • 전체 모델에서 고정 효과의 모든 상호 작용을 지정해야합니까 아니면 내가 실제로 관심이있는 효과 만 지정해야합니까?
  • 나는 모델에 STIM 요소를 포함시키지 않았는데, 이것은 시험에 사용 된 특정 자극 유형을 특징 짓지 만, 어떤 식 으로든 추정하고 싶지는 않습니다-123 레벨과 매우 적은 수의 무작위 인자로 지정해야합니까? 자극 유형 당 데이터 포인트?

여기서 조언을 찾을 수 없다면 누가 물어볼 수 있는지 모르겠습니다. 어쩌면 당신은 전용 혼합 모델 포럼이나 심지어 작은 돈을 상담하고자하는 전문가를 알고 있습니까?
Cel

3
@Cel 안녕하세요 . 5 방향, 4 방향 및 3 방향 상호 작용을 포함하여 모델에 모든 상호 작용이있는 것 같습니다 . 이 사례에 대해 잘 모르겠지만 일반적으로 데이터에 과도하게 적합하여 결과의 ​​일반화가 어려워집니다. 뒤로 선택 (사용해야하는 경우)은 완전히 포화 된 모델로 시작할 필요가 없습니다. 그럴듯한 가장 큰 모델로 시작해야합니다. 당신은 전혀 그것을 줄일 수 있습니까?
Macro

@ 매크로 잘 알고, 그때 그럴듯 해 보이는 상호 작용 만 포함합니다. 다른 문제에 대한 제안이 있습니까? 당신이 할 경우, 아마도 그것을 받아 들일 수 있도록 대답으로 넣으십시오.
Cel

답변:


16

각 질문에 차례로 답하겠습니다.

구문이 클러스터링 및 임의 효과를 올바르게 지정합니까?

여기에 적합한 모델은 수학적 용어로 모델입니다.

Yijk=Xijkβ+ηi+θij+εijk

어디

  • Yijk 는 개인 세션 동안 관찰 대한 반응 시간입니다 .kji

  • Xijk 는 개별 세션 동안 관찰 대한 예측 변수 벡터입니다 (작성한 모델에서 모든 주요 효과와 모든 상호 작용으로 구성됨).kji

  • ηi 사람이다 임의 효과가 같은 사람에 따라 만들어진 관찰 사이를 유도 상관 관계가. 는 개별 의 세션 대한 랜덤 효과 이고 는 남은 오류 항입니다.iθijijεijk

  • β 는 회귀 계수 벡터입니다.

여기서 14-15 페이지에 언급 것처럼 이 모델은 세션이 개인 내에 중첩되도록 지정하는 데 적합합니다 (설명의 경우).

구문을 넘어서이 모델이 위의 주제 내 디자인에 적합합니까?

데이터의 중첩 구조를 존중하기 때문에이 모델이 합리적이라고 생각하며,이 모델이 주장하는대로 개별 및 세션이 임의 효과로 합리적으로 구상 된 것으로 생각합니다. 선형 예측 변수 ( )가 올바르게 지정되었는지 확인하려면 예측 변수와 산점도 등의 반응 간의 관계를 살펴 봐야 합니다. 다른 표준 회귀 진단도 검사해야합니다.Xijkβ

전체 모델에서 고정 효과의 모든 상호 작용을 지정해야합니까 아니면 내가 실제로 관심이있는 효과 만 지정해야합니까?

나는 그렇게 심하게 포화 된 모델로 시작하는 것이 실질적으로 의미가 없다면, 좋은 아이디어가 아닐 수도 있다고 생각한다. 주석에서 말했듯이, 이것은 특정 데이터 세트에 과도하게 적합하고 결과의 일반화가 어려워 질 수 있습니다. 모델 선택과 관련하여 완전히 포화 된 모델로 시작하고 역방향 선택 ( 이 사이트의 일부 사람들은 정당한 이유가있는 대상 )을 수행 하는 경우 모델 의 계층 구조존중 해야합니다 . 즉, 모델에서 하위 수준 상호 작용을 제거하면 해당 변수와 관련된 모든 상위 수준 상호 작용도 삭제해야합니다. 이에 대한 자세한 내용은 연결된 스레드를 참조하십시오.

나는 모델에 STIM 요소를 포함시키지 않았는데, 이것은 시험에 사용 된 특정 자극 유형을 특징 짓지 만, 어떤 식 으로든 추정하고 싶지는 않습니다-123 레벨과 매우 적은 수의 무작위 인자로 지정해야합니까? 자극 유형 당 데이터 포인트?

응용 프로그램에 대해 아무것도 알지 못하더라도 (소금 한 덩어리로 가져 가십시오) 무작위 효과가 아닌 고정 효과처럼 들립니다. 즉, 치료 유형은 평균 자극의 고정 된 이동에 해당하는 변수처럼 들리지만 동일한 자극 유형을 가진 피험자간에 상관 관계를 유발하는 것은 아닙니다. 그러나 그것이 123 레벨 팩터라는 사실은 모델에 들어가기가 번거 롭습니다. 나는 이것이 당신이 기대할 수있는 효과가 얼마나 큰지 알고 싶다고 생각합니다. 효과의 크기에 관계없이 선형 모델이므로 기울기 추정치에 편향을 유발하지 않지만 표준 오차를 벗어나면 표준 오차가 이전보다 커질 수 있습니다.


2
와. 매크로 감사합니다. 더 많은 포인트를 줄 수 있기를 바랍니다.
Cel

랜덤 효과보다는 무작위 교차하기 때문에, 표기되어야 과 (보다는 ), 환자 교차 (중첩되지 않음) 때문에 사람? ηiθjθj
Joshua Rosenberg
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.