반복 측정 선형 혼합 효과 모델에 lmer 사용


41

편집 2 : 원래 한 요인에 대한 반복 측정으로 2 요인 분산 분석을 실행해야한다고 생각했지만 선형 혼합 효과 모델이 내 데이터에 더 효과적이라고 생각합니다. 나는 무슨 일이 필요한지 거의 알고 있다고 생각하지만 여전히 몇 가지 요점으로 혼란 스럽습니다.

분석해야 할 실험은 다음과 같습니다.

  • 대상은 여러 치료 그룹 중 하나에 배정되었다
  • 각 주제의 측정은 여러 날에 이루어졌다
  • 그래서:
    • 대상이 치료 내에 중첩되어 있음
    • 치료는 하루와 교차

(각 피험자는 하나의 치료에만 할당되며 매일 각 피험자에 대해 측정됩니다)

내 데이터 세트에는 다음 정보가 포함되어 있습니다.

  • 대상 = 차단 요인 (임의의 요인)
  • 일 = 주제 내 또는 반복 측정 계수 (고정 계수)
  • 치료 = 대상 인자 사이 (고정 인자)
  • Obs = 측정 (종속) 변수

UPDATE OK, 나는 통계 학자와 대화를 나 SAS지만 그는 SAS 사용자입니다. 그는 모델이 다음과 같아야한다고 생각합니다.

치료 + 일 + 대상 (치료) + 일 * 주제 (치료)

분명히 그의 표기법은 R 구문과 다르지만이 모델은 다음을 고려합니다.

  • 치료 (고정)
  • 요일 (고정)
  • 치료 * 일 상호 작용
  • 치료 내에서 중첩 된 대상 (무작위)
  • "치료 대상자"(임의)와 교차 한 날

그렇다면 이것이 올바른 구문입니까?

m4 <- lmer(Obs~Treatment*Day + (1+Treatment/Subject) + (1+Day*Treatment/Subject), mydata)

특히 "치료 대상자"부분과 교차 한 날이 옳은지에 대해 우려하고 있습니다. SAS에 익숙하거나 자신의 모델에서 무슨 일이 일어나고 있는지 이해하고 R 구문에서 슬픈 시도가 일치하는지에 대해 의견을 말할 수 있습니까?

다음은 모델을 작성하고 구문을 작성하려는 이전의 시도입니다 (답변 및 의견에서 논의 됨).

m1 <- lmer(Obs ~ Treatment * Day + (1 | Subject), mydata)

대상이 치료 내에 중첩되어 있다는 사실을 어떻게 처리합니까? 다음과 어떻게 m1다른가요?

m2 <- lmer(Obs ~ Treatment * Day + (Treatment|Subject), mydata)
m3 <- lmer(Obs ~ Treatment * Day + (Treatment:Subject), mydata)

그리고 동등 m2하고 m3동등하지 않은 이유는 무엇입니까?

또한 상관 구조를 (예 :) 지정하려면 lme4 대신 nlme를 사용해야 correlation = corAR1합니까? 반복 측정법 에 따르면 한 요인에 대한 반복 측정으로 반복 측정 분석을 수행하려면 공분산 구조 (동일한 대상의 측정 간 상관 특성)가 중요합니다.

반복 측정 ANOVA를 수행하려고 할 때 Type II SS를 사용하기로 결정했습니다. 이것은 여전히 ​​관련이 있으며 그렇다면 그렇다면 어떻게 지정해야합니까?

다음은 데이터 모양에 대한 예입니다.

mydata <- data.frame(
  Subject  = c(13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 29, 30, 31, 32, 33, 
               34, 35, 36, 37, 38, 39, 40, 62, 63, 64, 65, 13, 14, 15, 16, 17, 18, 
               19, 20, 21, 22, 23, 24, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 
               40, 62, 63, 64, 65, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 
               29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 62, 63, 64, 65), 
  Day       = c(rep(c("Day1", "Day3", "Day6"), each=28)), 
  Treatment = c(rep(c("B", "A", "C", "B", "C", "A", "A", "B", "A", "C", "B", "C", 
                      "A", "A", "B", "A", "C", "B", "C", "A", "A"), each = 4)), 
  Obs       = c(6.472687, 7.017110, 6.200715, 6.613928, 6.829968, 7.387583, 7.367293, 
                8.018853, 7.527408, 6.746739, 7.296910, 6.983360, 6.816621, 6.571689, 
                5.911261, 6.954988, 7.624122, 7.669865, 7.676225, 7.263593, 7.704737, 
                7.328716, 7.295610, 5.964180, 6.880814, 6.926342, 6.926342, 7.562293, 
                6.677607, 7.023526, 6.441864, 7.020875, 7.478931, 7.495336, 7.427709, 
                7.633020, 7.382091, 7.359731, 7.285889, 7.496863, 6.632403, 6.171196, 
                6.306012, 7.253833, 7.594852, 6.915225, 7.220147, 7.298227, 7.573612, 
                7.366550, 7.560513, 7.289078, 7.287802, 7.155336, 7.394452, 7.465383, 
                6.976048, 7.222966, 6.584153, 7.013223, 7.569905, 7.459185, 7.504068, 
                7.801867, 7.598728, 7.475841, 7.511873, 7.518384, 6.618589, 5.854754, 
                6.125749, 6.962720, 7.540600, 7.379861, 7.344189, 7.362815, 7.805802, 
                7.764172, 7.789844, 7.616437, NA, NA, NA, NA))

답변:


18

귀하의 접근 방식이 맞다고 생각합니다. 모델 m1은 각 주제에 대해 별도의 가로 채기를 지정합니다. 모델 m2은 각 주제에 대해 별도의 경사를 추가합니다. 대상은 하나의 치료 그룹에만 참여하기 때문에 귀하의 기울기는 며칠입니다. m2다음과 같이 모델을 작성 하면 각 주제에 대해 별도의 절편과 기울기를 모델링하는 것이 더 분명합니다

m2 <- lmer(Obs ~ Treatment * Day + (1+Day|Subject), mydata)

이것은 다음과 같습니다.

m2 <- lmer(Obs ~ Treatment + Day + Treatment:Day + (1+Day|Subject), mydata)

즉, 치료의 주요 효과, 요일 및 둘 사이의 상호 작용입니다.

치료군 내에서 대상체 ID를 반복하지 않는 한 중첩에 대해 걱정할 필요가 없다고 생각합니다. 어떤 모델이 올바른지, 실제로 연구 질문에 달려 있습니다. 치료 효과 외에 피험자의 기울기가 다양하다고 믿을만한 이유가 있습니까? 두 모델을 모두 실행하고 비교 anova(m1,m2)하여 데이터가 하나를 지원하는지 확인할 수 있습니다.

모델로 m3무엇 을 표현하고 싶은지 잘 모르겠 습니까? 중첩 구문은을 사용합니다 /(예 :) (1|group/subgroup).

그런 적은 수의 시점과의 자기 상관에 대해 걱정할 필요는 없다고 생각합니다.


이것은 정확하지 않습니다. 처리는 레벨 2 변수이며 주제 내에 중첩 될 수 없습니다.
Patrick Coulombe

자기 상관 및 시점 수 :이 예제 데이터에는 3 개만 표시되지만 실제 데이터에는 8 일 동안의 관측치가 포함되므로 문제가 될 수 있습니다. 그것을 넣는 방법에 대한 아이디어가 있습니까?
인과 관련

1
또한 이제는 중첩에 대해 상당히 혼란스러워합니다. (1+ 치료 | 제목)이 (1+ 치료 / 제목)과 다른가? "|"는 무엇입니까 평범한 영어로 말이죠? 내가 읽은 설명을 이해하지 못합니다.
인과 관련

안녕하세요. "각 과목마다 별도의 경사"는 무엇입니까? 주제는 연속 변수가 아니라 요인 변수이기 때문입니다.
skan

12

자동 상관 오류 문제 (lme4와 nlme의 다른 구현에 대해서는 아님)에 대해 충분히 의견이 충분하지 않지만 나머지는 말할 수 있습니다.

모델 m1은 치료와 일 사이에 교차 수준 상호 작용을 포함시킨 무작위 절편 모델입니다 (일의 효과는 치료 그룹마다 다름). 참가자에 따라 시간에 따른 변화가 달라 지도록 (즉, 시간에 따른 변화의 개별 차이를 명시 적으로 모델링하기 위해) Day의 효과가 무작위 가되도록 허용해야합니다 . 이렇게하려면 다음을 지정하십시오.

m2 <- lmer(Obs ~ Day + Treatment + Day:Treatment + (Day | Subject), mydata)

이 모델에서 :

  • Day = 0의 치료 참조 범주에 대해 예측 된 점수 인 경우 절편
  • 일의 계수는 치료 참조 범주에 대해 일 단위로 1 단위 씩 증가 할 때마다 시간에 따른 예측 된 변화입니다.
  • 처리 그룹에 대한 두 개의 더미 코드에 대한 계수 (R에 의해 자동으로 생성됨)는 각 나머지 처리 그룹과 Day = 0의 기준 범주 사이의 예측 된 차이입니다.
  • 두 상호 작용 항에 대한 계수는 참조 범주와 나머지 치료 그룹 간의 예측 점수에 대한 시간 효과 (Day)의 차이입니다.

차단에 대한 요일과 점수에 미치는 영향은 모두 무작위입니다 (각 피험자는 Day = 0에서 예측 점수가 다르고 시간이 지남에 따라 선형 변화가 달라짐). 절편과 슬로프 사이의 공분산도 모델링되고 있습니다 (수집 가능).

보시다시피, 두 더미 변수에 대한 계수 해석은 Day = 0에 조건부로 적용됩니다. 기준 범주에 대해 Day = 0의 예측 점수가 나머지 두 치료군과 유의 한 차이가 있는지 알려줍니다. 따라서 일 변수를 중심으로 결정하는 위치가 중요합니다. 1 일을 중심으로하는 경우 계수는 1 일의 기준 범주 대한 예측 점수가 나머지 두 그룹의 예측 점수와 크게 다른지 여부를 알려줍니다 . 이렇게 하면 그룹간에 기존 차이점 이 있는지 확인할 수 있습니다 . 3 일을 중심으로하는 경우 계수는 3 일 의 참조 범주 대한 예측 점수를 알려줍니다.나머지 두 그룹의 예상 점수와는 크게 다릅니다. 이렇게 하면 개입이 끝날 때 그룹간에 차이가 있는지 확인할 수 있습니다 .

마지막으로, 대상은 처리 내에 중첩 되지 않습니다 . 세 가지 치료법은 결과를 일반화하려는 수준의 모집단의 무작위 수준이 아니며, 언급 한 것처럼 수준이 고정되어 있으며 결과를이 수준으로 만 일반화하려고합니다. (물론 상위 레벨 단위가 3 개인 경우 멀티 레벨 모델링을 사용해서는 안됩니다. Maas & Hox, 2005 참조) 대신, 치료는 레벨 2 예측기, 즉 일 단위에서 단일 값을 취하는 예측기입니다. 각 과목에 대해 (레벨 1 단위). 따라서 모형에 예측 변수로만 포함됩니다.

참조 :
Maas, CJM, & Hox, JJ (2005). 다단계 모델링을위한 충분한 샘플 크기. 방법론 : 행동 및 사회 과학을위한 유럽 연구 방법론 , 1 , 86-92.


1
obs <= 수의 랜덤 효과 및 잔차 분산의 수를 식별 할 수 없기 때문에 lmer로 추정 할 수 없습니다.
Shuguang

답변의 수식 구조가 정확합니다. @Shuguang에서 언급 한 오류를 무시하려면을 추가해야합니다 ...,control=lmerControl(check.nobs.vs.nRE="ignore"). Ben Bolker의 자세한 설명 은이 링크 를 참조하십시오 .
NiuBiBang

좋은 설명입니다. "피험자가 치료 내에 중첩되지 않은"이유와 왜 + (치료 | 주제) 오류 용어를 작성하지 않는지, 왜 (1 | 주제) 또는 (1 | 치료 * 일이 아닌지) 설명하십시오 )?
skan

기술적으로 치료 내에 피험자를 내포 할 있지만, 예측자가 실험을 몇 번이나 실행하더라도 동일한 예측 변수 인 경우 고정 된 (임의가 아닌) 효과 여야합니다. 요인 것이 그 시작 값 또는 시간이 지남에 따라 치료의 변화에 자신의 특이한 반응을 예 - - 당신이 그런 대상의 개별 특성과 실험을 실행마다 다를 수는 임의 효과입니다. (1 + Day|Subject)는 임의의 기울기 모델을 의미하며, 각 대상의 초기 값 (절편)과 결과 변화율이 다를 수 있습니다.
llewmills
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.