고정 된 효과가 임의의 효과 내에 중첩되거나 R (aov 및 lmer)에서 반복 측도를 코딩하는 방법이 합리적입니까?


23

@conjugateprior의 lm / lmer R 공식 개요를 살펴 보고 다음 항목으로 인해 혼란스러워했습니다.

이제 A는 무작위이지만 B는 고정되어 있고 B는 A 안에 중첩되어 있다고 가정합니다.

aov(Y ~ B + Error(A/B), data=d)

아래의 유사한 혼합 모델 공식 lmer(Y ~ B + (1 | A:B), data=d) 이 동일한 경우에 제공됩니다.

나는 그것이 무엇을 의미하는지 이해하지 못한다. 피험자들이 여러 그룹으로 나누어 진 실험에서, 우리는 고정 인자 (그룹) 내에 중첩 된 무작위 인자 (대상)를 가질 것입니다. 그러나 어떻게 고정 요인을 랜덤 요인 내에 중첩시킬 수 있습니까? 임의의 주제 안에 중첩 된 문제가 있습니까? 가능합니까? 가능하지 않은 경우 이러한 R 공식이 의미가 있습니까?


이 개요는 R의 반복 측정에 대한이 학습서를 기반 으로 R에서 ANOVA를 수행하는 방법 에 대한 성격 프로젝트의 페이지를 부분적으로 기반으로합니다 . 반복 측정 ANOVA에 대한 다음 예가 제공됩니다.

aov(Recall ~ Valence + Error(Subject/Valence), data.ex3)

여기서 대상은 다양한 원자가 (3 가지 수준의 요인)의 단어가 제시되고 그들의 회수 시간이 측정됩니다. 각 주제에는 3 가의 모든 수준의 단어가 제공됩니다. 나는 (그것을 따라, 교차 나타납니다이 디자인에 중첩 아무것도 표시되지 않습니다 여기에 훌륭한 대답 나는 순진하게도 그 생각 때문에)하고, Error(Subject)또는 (1 | Subject)이 경우 적절한 임의의 기간이어야한다. Subject/Valence"중첩은"(?) 혼란.

내가 그 이해 않음을 참고 ValenceA는 피험자 내 요인. 그러나 나는 모든 과목이 세 가지 수준을 모두 경험하기 때문에 과목 내에서 "중첩 된"요소 가 아니라고 생각합니다 Valence.


최신 정보. R에서 반복 측정 ANOVA를 코딩하는 방법에 대한 CV에 대한 질문을 탐색 중입니다.

  • 여기서 다음은 고정 대상 내 / 반복 측정 A 및 임의에 사용됩니다 subject.

    summary(aov(Y ~ A + Error(subject/A), data = d))
    anova(lme(Y ~ A, random = ~1|subject, data = d))
  • 여기 에 2 개의 고정 대상 내 / 반복 측정 효과 A와 B가 있습니다.

    summary(aov(Y ~ A*B + Error(subject/(A*B)), data=d))
    lmer(Y ~ A*B + (1|subject) + (1|A:subject) + (1|B:subject), data=d) 
  • 다음 은 3 가지 개체 내 효과 A, B 및 C에 대한 것입니다.

    summary(aov(Y ~ A*B*C + Error(subject/(A*B*C)), data=d))
    lmer(Y ~ A*B*C + (1|subject) + (0+A|subject) + (0+B|subject) + (0+C|subject) + (0+A:B|subject) + (0+A:C|subject) + (0+B:C|subject), data = d)

내 질문 :

  1. Error(subject/A)그렇지 Error(subject)않습니까?
  2. 그것은인가 (1|subject)또는 (1|subject)+(1|A:subject)단순히 (1|A:subject)?
  3. 그것은인가 (1|subject) + (1|A:subject)또는 (1|subject) + (0+A|subject), 그 이유는 단순히 (A|subject)?

지금까지 나는 이러한 것들 중 일부가 동등하다고 주장하는 일부 스레드를 보았습니다 (예를 들어, 첫 번째 : 그것들은 동일 하지만 반대 주장 이지만 SO : 세 번째 는 동일하다는 주장입니다 ). 그들이 있습니까?


2
엄밀히 말해서 개념적 으로 말하면 , 임의의 요소에 고정 된 요소가 중첩되어 있다는 것은 사실상 의미가 없습니다. 나는 적어도 하나의 교과서 저자가 말한 것을 읽었습니다 (현재 참조를 기억할 수는 없습니다). 즉, 위에서 작성한 모델 사양 중 일부는 더 이해하기 쉬운 모델과 통계적으로 동일하게 작동 할 수 있습니다.
Jake Westfall

4
실제로 R이 A / B 구문을 해석하는 방식에 대해 생각하면 의미가 있다고 생각합니다. 단순히 이것을 A + A : B로 확장합니다. 우리가 임의의 용어처럼 생각 그렇다면 subject/condition반대의 경우 명확하게, 조건이 주제에 중첩 된 제안 보이지만, 맞는 실제로 모델이기 때문에, 이것은 개념적으로 반신 반의 subject + subject:condition임의의 대상이 효과를 완벽하게 유효한 모델이다, 그리고 임의의 대상 X 경사.
Jake Westfall

@JakeWestfall 고마워, 이것은 지금까지 내가 생각하는 선을 따라 있지만, 누군가 그것을 올바르게 설명하고 싶습니다. 실제로 이것은 사소한 질문으로 판명되었습니다. 나는 당신이 곧바로 대답 할 사람들 중 하나가 되길 기대했을 것입니다. 그러나 이것은 원래 혼란이 멍청해야한다고 생각한 것처럼 안도감입니다. 그건 그렇고, 표준 참조 lmaov수식이 있습니까? 정확히 무엇 aovlm하는가 (? 의 래퍼 인가)와 Error()용어의 작동 방식 에 대한 권위있는 출처를 원한다면 어디를 봐야합니까?
amoeba는 Reinstate Monica

1
@amoeba 예, 최소 제곱 적합에 사용되는 의미 aov의 래퍼 이지만 추가 작업을 수행합니다 (특히 용어를 번역 함 ). 신뢰할 수있는 소스는 소스 코드 또는 가능한 경우 : Chambers et al (1992)에 제공된 참조 입니다. 그러나 해당 참조에 액세스 할 수 없으므로 소스 코드를 살펴볼 것입니다. lmlmaovErrorlmhelp("aov")
Roland

답변:


12

혼합 모형에서 고정 또는 랜덤으로 요인을 처리하는 것은 특히 교차, 부분 교차 또는 중첩 여부와 관련하여 많은 혼란을 초래할 수 있습니다. 또한, anova / designed 실험 세계와 혼합 / 다단계 모델 세계에서 중첩이 의미하는 것과 용어간에 차이가있는 것으로 보입니다.

나는 모든 대답을 알고 있다고 공언하지 않으며, 나의 대답은 완전하지 않으며 (추가 질문이 생길 수 있음) 여기에서 몇 가지 문제를 해결하려고 노력할 것입니다.

고정 된 효과가 임의의 효과 내에 중첩되거나 R (aov 및 lmer)에서 반복 측도를 코딩하는 방법이 합리적입니까?

(질문 제목)

아니요, 나는 이것이 의미가 있다고 생각하지 않습니다. 우리가 반복 측정을 다룰 때, 일반적으로 측정이 반복된다는 것은 무엇이든 무작위 일 것입니다. 그냥 호출하고 Subject, lme4우리는 Subject하나 이상의 오른쪽에 |임의의 부분에 포함시키고 싶습니다 . 공식. 다른 임의의 효과가있는 경우 이러한 효과는 교차되거나 부분적으로 교차되거나 중첩됩니다. 질문에 대한 답변은 문제를 해결합니다.

이러한 anova-type 설계 실험의 문제는 반복적 인 측정 상황에서 일반적으로 수정 된 것으로 간주되는 요소를 처리하는 방법으로 보이며 OP 본문에 대한 질문은 다음과 같습니다.

왜 오류 (제목)가 아닌 오류 (제목 / A)입니까?

나는 보통 aov()무언가를 놓칠 수 있도록 사용하지 않지만, 나에게 연결된 질문Error(subject/A) 의 경우에는 오도의 소지가 있습니다. 사실 정확히 같은 결과를 가져옵니다.Error(subject)

(1 | 대상) 또는 (1 | 대상) + (1 | A : 대상) 또는 단순히 (1 | A : 대상)입니까?

이것은 질문 과 관련 있습니다. 이 경우 다음의 모든 랜덤 효과 공식은 정확히 동일한 결과를 가져옵니다.

(1|subject)
(1|A:subject)
(1|subject) + (1|A:subject)
(1|subject) + (1|A:subject) + (1|B:subject)

그러나 이것은 질문의 시뮬레이션 된 데이터 세트에 어떤 변형도 없기 때문에로 생성됩니다 Y = rnorm(48). 의 데이터 세트와 같은 실제 데이터 cake세트를 사용 lme4하는 경우 일반적으로 그렇지 않습니다. 문서에서 실험 설정은 다음과 같습니다.

세 가지 다른 레시피로 만들어지고 6 가지 다른 온도에서 구운 초콜릿 케이크의 파손 각도에 대한 데이터. 이것은 레시피가 전체 장치이고 다른 온도가 하위 장치에 적용되는 스플릿 플롯 설계입니다 (복제 내). 실험 노트는 복제 번호 매기기가 시간 순서를 나타냅니다.

다음 5 개의 변수에 대한 270 개의 관측치가있는 데이터 프레임.

replicate 1에서 15까지의 계수

recipe 레벨 A, B 및 C를 가진 요인

temperature 레벨이 175 <185 <195 <205 <215 <225 인 순서 인수

temp 베이킹 온도의 숫자 값 (F).

angle 케이크가 부러진 각도를 나타내는 숫자 형 벡터.

따라서 우리는에서 측정을 반복 replicate했으며 고정 요소에도 관심이 recipe있으며 temperature( temp이것은 다른 코딩이므로 무시할 temperature수 있음) 다음을 사용하여 상황을 시각화 할 수 있습니다 xtabs.

> xtabs(~recipe+replicate,data=cake)

     replicate
recipe 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
     A 6 6 6 6 6 6 6 6 6  6  6  6  6  6  6
     B 6 6 6 6 6 6 6 6 6  6  6  6  6  6  6
     C 6 6 6 6 6 6 6 6 6  6  6  6  6  6  6

경우 recipe임의의 효과이었다 우리는 이러한 무작위 효과를 교차 것을 말할 것입니다. 결코 다른 복제에 recipe A속하지 않습니다 replicate 1.

> xtabs(~temp+replicate,data=cake)

     replicate
temp  1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
  175 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  185 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  195 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  205 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  215 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  225 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3

마찬가지로 temp.

따라서 우리가 적합 할 첫 번째 모델은 다음과 같습니다.

> lmm1 <-  lmer(angle ~ recipe * temperature + (1|replicate), cake, REML= FALSE)

이것은 각각 replicate을 무작위 변이의 유일한 원천으로 취급 할 것 입니다 (물론 잔차 제외). 그러나 레시피 간에는 임의의 차이가있을 수 있습니다. 따라서 우리는 recipe또 다른 (교차 된) 임의 효과 로 포함 하고 싶을 수도 있지만 3 수준 만 recipe있으므로 모델이 분산 성분을 잘 예측할 수 없기 때문에 바람직하지 않습니다. 대신 replicate:recipe그룹화 변수로 사용하여 각 복제 및 레시피 조합 을 별도의 그룹화 요소로 취급 할 수 있습니다. 위의 모델을 사용하면 레벨에 대해 15 개의 랜덤 인터셉트를 replicate갖게되며 이제 각 개별 조합에 대해 45 개의 랜덤 인터셉트를 갖게됩니다.

lmm3 <-  lmer(angle ~ recipe * temperature + (1|replicate:recipe) , cake, REML= FALSE)

레시피로 인해 임의의 가변성이 있지만 그다지 크지 않다는 것을 나타내는 (약간) 다른 결과가 있습니다.

우리도 마찬가지로 같은 일을 할 수 temperature있습니다.

이제 질문으로 돌아가서

왜 또는 심지어 간단 (1|subject) + (1|A:subject)하지 않습니까?(1|subject) + (0+A|subject)(A|subject)

나는 이것이 (랜덤 슬로프를 사용하여) 어디서 왔는지 잘 모르겠습니다 .2 개의 연결된 질문에서 발생하지 않는 것 같습니다. 그러나 내 문제 (1|subject) + (1|A:subject)는 이것이 에 중첩 된 (1|subject/A)의미 와 정확히 동일 하다는 것입니다. turn은 (나에게) 각 레벨의 레벨이 1에서 발생하고 1 레벨 만이 여기에 분명히 해당하지 않음을 의미합니다.AsubjectAsubject

이 답변에 대해 더 많이 생각한 후에이 답변을 추가하거나 편집 할 수는 있지만 초기 생각을 낮추고 싶었습니다.


고마워요 (+1). cake데이터 세트를 이해하지 못했습니다 . 복제는 레시피에 중첩되어있는 것 같습니다. 그 이유 xtabs는 그것이 당신이 중첩 대 교차 대답에 묘사 한 이유와 정확히 일치하지 않습니다 : 복제는 1-45가 아닌 1-15로 혼란스럽게 코딩됩니다. 각 레시피에 대해 6 개의 케이크로 15 개의 "복제"를 만들었습니다. 각 케이크는 다른 온도에서 구워졌다. 따라서 레시피는 개체 간 요인이고 온도는 개체 간 요인입니다. 따라서 귀하의 답변에 따르면 (1|recipe/replicate). 아니? (1|replicate:recipe)아마도 같은 것입니다.
아메바는

내 질문은 주제 내 요인에만 집중했기 때문에 cake단일 레시피로만 제한 하는 것과 같습니다 . 어디에서 왔는지 확실하지 않다고 말하는 세 번째 요점에 대해서는 세 가지 주제 내 요인의 예와 함께 내 Q의 마지막 링크를 참조하십시오. 이 Q에 따라 Jake의 상향식 의견을 참조하십시오.
amoeba는

그리고에 대한 aov당신이 그 것 그 권리입니다 Error(subject/A)Error(subject)이 다른 요소가없는 경우 동일한 결과를 얻을 수 있지만, 두 가지 요인에 링크 된 스레드에서 예를 가지고 가고, Error(subject/(A*B))그리고 Error(subject)해당되지 않습니다. 내 현재 이해는 전자가 임의의 경사를 포함하기 때문입니다.
amoeba는

@amoeba cake데이터 세트는 좋은 작동 예제가 아닙니다. 사과드립니다. 나는 그것에 대해 조금 더 깊이 살펴보고 아마도 더 나은 그림을 찾으려고 노력할 것입니다.
Robert Long

감사. Placidia가 준비중인 업데이트뿐만 아니라 모든 업데이트를 기대합니다. 그 동안 나는 현상금을 줄 것입니다.
아메바는 모니카의 복원을 말한다

3

죄송합니다. 경고 댓글 작성자는 내 게시물에 넌센스가 가득하다는 것을 발견했습니다. 중첩 된 디자인과 반복 된 측정 디자인을 혼동하고있었습니다.

사이트 는 중첩 측정 값과 반복 측정 값 디자인의 차이점에 대한 유용한 분석을 제공합니다. 흥미롭게도, 저자는 고정 범위 내에서 고정, 무작위 내에서 고정 및 임의 내에서 임의의 고정되지 않은 예상 평균 제곱을 보여줍니다. 그것이 무엇을 의미하는지는 상상하기 어렵습니다. 레벨 A의 요인이 무작위로 선택되면 무작위성이 이제 레벨 B의 요인 선택에 적용됩니다. 각 학교 (학교에 내포 된 교사)로부터 선택된 "교사"요소의 수준은 이제 무작위 학교 선택으로 인해 학교위원회에서 무작위로 교사를 선택합니다. 실험에 참여할 선생님을 "수정"할 수 없습니다.


2
+1 감사합니다. 당신의 대답에있는 모든 것이 나에게 의미가 있습니다. 그러나 "중첩"이라는 단어가 두 가지 의미로 사용되고 있으며 이것이 혼란을 야기한다는 데 동의해야한다고 생각합니다. @RobertLong은 B의 각 레벨이 다른 레벨의 AEg 클래스와 함께 발생할 때 A는 B에 중첩되어 있다고 말합니다. 예를 들어 과목은 치료 / 통제 요소 내에 중첩됩니다. 당신은 시간이 주제 안에 중첩되어 있다고 말하지만, 모든 레벨은 모든 주제에서 발생하므로 Robert는 교차한다고 말합니다! 이것은 다른 "중첩"입니다. 권리?
amoeba는

1
귀하의 예에서 시간과 치료는 고정 된 효과라는 것이 분명하지만, 시간이 환자 내에 중첩되어 있다는 것은 분명하지 않습니다. "중첩 된"정의를 제공 할 수 있습니까?
Joe King

내 실수. 나는 혼란스럽고 반복되는 측정을 혼란 스러웠습니다. 나는 내 대답을 다시 바꿨다.
Placidia

실제로 나는 오늘 초의 수정 / 추가로 귀하의 원래 답변을 좋아했습니다. 내 질문에 대한 유용한 정보가 많이 있습니다. 여기에서 "반복 된 조치"에 실제로 관심이 있기 때문입니다. 이전 개정판을 유지하는 것이 좋습니다!
amoeba는 Reinstate Monica

2
글을 쓰는 동안 반복 측정에서 임의의 효과가 중첩된다는 것을 깨달았고 수학이 어떻게 작동하는지와 자유도를 테스트하고 싶습니다. 내가 이것을 못 박았다고 확신 할 때 나는 대답을 증폭시킬 것이다!
Placidia
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.