중첩이있는 혼합 효과 모델


34

다음과 같이 구성된 실험에서 수집 한 데이터가 있습니다.

각각 30 그루의 나무가있는 두 곳. 15 개가 치료되고 15 개가 각 현장에서 통제됩니다. 각 나무에서 우리는 줄기 세 조각과 뿌리 세 조각을 샘플링하므로 나무 당 6 레벨 1 샘플이 두 요소 수준 (뿌리, 줄기) 중 하나로 표시됩니다. 그런 다음 줄기 / 뿌리 샘플에서 샘플 내 다른 조직을 해부하여 두 개의 샘플을 채취합니다.이 샘플은 조직 유형 (조직 유형 A, 조직 유형 B)의 두 가지 요인 수준 중 하나로 표시됩니다. 이 샘플은 연속 변수로 측정됩니다. 총 관측치 수는 720입니다. 2 개 사이트 * 30 그루의 나무 * (3 개의 줄기 샘플 + 3 개의 루트 샘플) * (1 개의 조직 A 샘플 + 1 개의 조직 B 샘플). 데이터는 다음과 같습니다.

        ï..Site Tree Treatment Organ Sample Tissue Total_Length
    1        L  LT1         T     R      1 Phloem           30
    2        L  LT1         T     R      1  Xylem           28
    3        L  LT1         T     R      2 Phloem           46
    4        L  LT1         T     R      2  Xylem           38
    5        L  LT1         T     R      3 Phloem          103
    6        L  LT1         T     R      3  Xylem           53
    7        L  LT1         T     S      1 Phloem           29
    8        L  LT1         T     S      1  Xylem           21
    9        L  LT1         T     S      2 Phloem           56
    10       L  LT1         T     S      2  Xylem           49
    11       L  LT1         T     S      3 Phloem           41
    12       L  LT1         T     S      3  Xylem           30

R과 lme4를 사용하여 혼합 효과 모델을 맞추려고하지만 혼합 모델이 처음입니다. 두 레벨 내에 중첩 된 특정 샘플에 대해 임의의 효과를 사용하여 처리 + 레벨 1 요인 (줄기, 뿌리) + 레벨 2 요인 (조직 A, 조직 B)으로 반응을 모델링하고 싶습니다.

R에서는 다음과 같이 lmer을 사용 하여이 작업을 수행하고 있습니다.

fit <- lmer(Response ~ Treatment + Organ + Tissue + (1|Tree/Organ/Sample)) 

내 이해에서 (... 확실하지 않으며 왜 게시하고 있는지!)

(1|Tree/Organ/Sample)

'샘플'이 트리 내에 중첩 된 오르간 샘플 내에 중첩되도록 지정합니다. 이런 종류의 중첩은 관련성이 있고 유효합니까? 이 질문이 명확하지 않다면 죄송합니다. 정교화 할 수있는 곳을 지정하십시오.

답변:


33

나는 이것이 맞다고 생각한다.

  • (1|Tree/Organ/Sample)확장 (1|Tree)+(1|Tree:Organ)+(1|Tree:Organ:Sample)( :또는 상호 작용을 나타냄)
  • 고정 요인 Treatment, Organ그리고 Tissue자동으로 올바른 수준에서 처리 얻을.
  • Site고정 된 효과로 포함시켜야 합니다 (개념적으로는 임의의 효과이지만 두 사이트만으로 사이트 간 차이를 추정하는 것은 실용적이지 않습니다). 이렇게하면 트리 간 차이가 약간 줄어 듭니다.
  • 데이터 프레임 내에 모든 데이터를 포함 lmer시키고 data=my.data.frame인수 를 통해 명시 적으로 전달해야합니다 .

glmm FAQ가 도움 이 될 것입니다 (GLMM에 중점을두고 있지만 선형 혼합 모델과 관련된 내용도 있습니다).


Erik이 이러한 절편에 대해 공분산 구조를 지정하려면 어떻게해야합니까? 즉, 양성 트리 차단이있는 샘플에도 양성 장기 차단이있을 것으로 예상 할 수 있습니다. 중첩이이 문제를 자동으로 처리합니까? 그렇지 않다면 어떻게 그러한 구조를 지정할 수 있습니까?
Sheridan Grant

나는 당신이 그 경우에 대한 방정식을 쓰려고하면 그것이 처리되었음을 알 수 있다고 생각합니다.
벤 볼커

13

이 질문과 Bolker 박사의 답변을 읽고 데이터를 복제하려고했습니다 (솔직히 말해서 생물학적 용어 또는 단위로 "길이"가 무엇을 나타내는 지에 대해 신경 쓰지 않고 위와 같이 모델에 적합합니다. 여기에 결과를 게시합니다.) 오해의 가능성이있는 부분에 대한 의견을 공유하고 구합니다.

이 가상의 데이터를 생성하는 데 사용한 코드는 here 에서 찾을 수 있으며 데이터 세트는 OP의 내부 구조를 갖습니다.

     site     tree treatment organ sample tissue    length
1    L       LT01         T  root      1  phloem  108.21230
2    L       LT01         T  root      1  xylem   138.54267
3    L       LT01         T  root      2  phloem   68.88804
4    L       LT01         T  root      2  xylem   107.91239
5    L       LT01         T  root      3  phloem   96.78523
6    L       LT01         T  root      3  xylem    88.93194
7    L       LT01         T  stem      1  phloem  101.84103
8    L       LT01         T  stem      1  xylem   118.30319

구조는 다음과 같습니다.

 'data.frame':  360 obs. of  7 variables:
     $ site     : Factor w/ 2 levels "L","R": 1 1 1 1 1 1 1 1 1 1 ...
 $ tree     : Factor w/ 30 levels "LT01","LT02",..: 1 1 1 1 1 1 1 1 1 1 ...
     $ treatment: Factor w/ 2 levels "C","T": 2 2 2 2 2 2 2 2 2 2 ...
 $ organ    : Factor w/ 2 levels "root","stem": 1 1 1 1 1 1 2 2 2 2 ...
     $ sample   : num  1 1 2 2 3 3 1 1 2 2 ...
 $ tissue   : Factor w/ 2 levels "phloem","xylem": 1 2 1 2 1 2 1 2 1 2 ...
     $ length   : num  108.2 138.5 68.9 107.9 96.8 ...

데이터 세트는 다음과 같이 "리깅"되었습니다 (여기서 피드백을 환영합니다).

  1. 의 경우 treatment, 치료 대 대조군 ( 10070)에 대한 두 가지 뚜렷한 절편으로 고정 효과가 있으며 임의의 효과는 없습니다.
  2. 나는 대 ( 와 )에 tissue대한 매우 다른 절편으로 눈에 띄는 고정 효과로 값을 설정하고 a로 임의 효과를 설정했습니다 .phloemxylem36sd = 3
  3. organ(0,)sd = 36rootstem
  4. 들어 tree우리는 단지 랜덤 효과를 sd = 7.
  5. 들어 sample난 만 임의 효과를 설정하기 위해 노력했다 sd = 5.
  6. 에 대한 위해 site도 무작위 EFF와 함께입니다 sd = 3.

변수의 범주 특성으로 인해 기울기가 설정되지 않았습니다.

혼합 효과 모델의 결과 :

fit <- lmer(length ~ treatment + organ + tissue + (1|tree/organ/sample), data = trees) 

있었다 :

 Random effects:
 Groups              Name        Variance  Std.Dev. 
 sample:(organ:tree) (Intercept) 9.534e-14 3.088e-07
 organ:tree          (Intercept) 0.000e+00 0.000e+00
 tree                (Intercept) 4.939e+01 7.027e+00
 Residual                        3.603e+02 1.898e+01
Number of obs: 360, groups:  sample:(organ:tree), 180; organ:tree, 60; tree, 30

Fixed effects:
            Estimate Std. Error       df t value Pr(>|t|)    
(Intercept)  79.8623     2.7011  52.5000  29.567  < 2e-16 ***
treatmentT   21.4368     3.2539  28.0000   6.588 3.82e-07 ***
organstem     0.1856     2.0008 328.0000   0.093    0.926    
tissuexylem   3.1820     2.0008 328.0000   1.590    0.113    
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

어떻게 작동 했습니까?

  1. 의 경우 treatment치료없이 차단했다 79.8623(I는 평균 설정 70), 그리고 그것이 치료 79.8623 + 21.4368 = 101.2991(우리의 평균 설정 100.
  2. 에 대한 요격 tissue에 대한 3.1820기여 가 있었기 때문에 와 의 xylem차이를 설정했습니다 . 랜덤 효과는 모델의 일부가 아닙니다.phloemxylem3
  3. 를 들어 organ,로부터 샘플 stem로 절편을 증가 0.1856- 나는 사이의 고정 효과에 차이 설정할 수 없었다 stemroot. 무작위 효과로 사용하고 싶었던 표준 편차는 반영되지 않았습니다.
  4. tree의 SD와 임의 효과 7로 잘 떠올랐다 7.027.
  5. 에 관해서는 sample, 초기 sd의이 5같은 강조해도 지나치지했다 3.088.
  6. site 모델의 일부가 아니 었습니다.

따라서 전반적으로 모델이 데이터의 구조와 일치하는 것처럼 보입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.