glmm에서 R 구조 G 구조 란 무엇입니까?


16

MCMCglmm최근 에 패키지를 사용하고 있습니다. 설명서에서 R 구조 및 G 구조라고하는 것에 혼동됩니다. 이는 임의의 영향과 관련이있는 것 같습니다. 특히 이전 분포에 대한 모수를 지정하지만 설명서의 설명은 독자가 이러한 용어가 무엇인지 알고 있다고 가정합니다. 예를 들면 다음과 같습니다.

R (R- 구조) G (G- 구조) 및 B (고정 효과) : )는 역 위시 아트에 대한 예상 (공) 분산 (V) 및 신념도 매개 변수 (nu)가있는 목록입니다.

... 여기 에서 가져 왔습니다 .

편집 : Stephane의 의견에 따라 나머지 질문을 다시 작성했습니다.

캔 누구든지 간단한 분산 요소 모델의 관점에서, R-구조 G 구조가 무엇 비추고 여기서 선형 예측이다 와 및

β0+e0ij+u0j
e0ijN(0,σ0e2)u0jN(0,σ0u2)

함께 제공되는 일부 데이터로 다음 예제를 만들었습니다. MCMCglmm

> require(MCMCglmm)
> require(lme4)
> data(PlodiaRB)
> prior1 = list(R = list(V = 1, fix=1), G = list(G1 = list(V = 1, nu = 0.002)))
> m1 <- MCMCglmm(Pupated ~1, random = ~FSfamily, family = "categorical", 
+ data = PlodiaRB, prior = prior1, verbose = FALSE)
> summary(m1)


 G-structure:  ~FSfamily

         post.mean l-95% CI u-95% CI eff.samp
FSfamily    0.8529   0.2951    1.455      160

 R-structure:  ~units

      post.mean l-95% CI u-95% CI eff.samp
units         1        1        1        0

 Location effects: Pupated ~ 1 

            post.mean l-95% CI u-95% CI eff.samp  pMCMC    
(Intercept)   -1.1630  -1.4558  -0.8119    463.1 <0.001 ***
---

> prior2 = list(R = list(V = 1, nu = 0), G = list(G1 = list(V = 1, nu = 0.002)))
> m2 <- MCMCglmm(Pupated ~1, random = ~FSfamily, family = "categorical", 
+ data = PlodiaRB, prior = prior2, verbose = FALSE)
> summary(m2)


 G-structure:  ~FSfamily

         post.mean l-95% CI u-95% CI eff.samp
FSfamily    0.8325   0.3101    1.438    79.25

 R-structure:  ~units

      post.mean l-95% CI u-95% CI eff.samp
units    0.7212  0.04808    2.427    3.125

 Location effects: Pupated ~ 1 

            post.mean l-95% CI u-95% CI eff.samp  pMCMC    
(Intercept)   -1.1042  -1.5191  -0.7078    20.99 <0.001 ***
---

> m2 <- glmer(Pupated ~ 1+ (1|FSfamily), family="binomial",data=PlodiaRB)
> summary(m2)
Generalized linear mixed model fit by the Laplace approximation 
Formula: Pupated ~ 1 + (1 | FSfamily) 
   Data: PlodiaRB 
  AIC  BIC logLik deviance
 1020 1029   -508     1016
Random effects:
 Groups   Name        Variance Std.Dev.
 FSfamily (Intercept) 0.56023  0.74849 
Number of obs: 874, groups: FSfamily, 49

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  -0.9861     0.1344  -7.336  2.2e-13 ***

Stephane의 의견에 따르면 G 구조는 입니다. 그러나 의견에 따르면 R 구조는 것이지만 출력 에는 나타나지 않는 것 같습니다 .σ0u2σ0e2lme4

의 결과 lme4/glmer()는 MCMC의 두 예제와 일치 MCMCglmm합니다.

따라서 의 R 구조 이며 이것이 왜 출력에 나타나지 않습니까?σ0e2lme4/glmer()


1
SAS 용어 (그러나 아마도 더 일반적인 용어 일 수 있음)에서 G 행렬은 랜덤 효과의 분산 행렬이고 R 행렬은 "오류 항"의 분산 행렬입니다 (귀하의 경우 추정 잔차 일 수 있습니다) variance ?)σ0e2
Stéphane Laurent

@ StéphaneLaurent 감사합니다. 로 추정 될 수 있을지 궁금 했지만, 일반화 된 선형 모형에 대해 처음 알게되었을 때 는 추정되지 않았다는 점을 기억하십시오 . 어쩌면 내가 뭔가를 놓치고 있습니까? σ0e2σ0e2lme4
Joe King

1
분포 패밀리가 가우스가 아닌 경우 잔차 분산의 의미가 명확하지 않을 수 있습니다.
Stéphane Laurent

1
@ Stéphane Laurent 네! 1 분 전 Michael의 답변에 대한 내 의견을 참조하십시오. 이진 결과의 경우 수정되어야합니다 (내 OP의 모델과 동일)
Joe King

1
ME / 멀티 레벨 모델을 사용하는 경우 몇 가지 차이가 ​​있습니다. 가장 간단한 경우를 상상해보십시오 : . 절편 및 오류 용어 있습니다. 는 종종 랜덤 효과의 var-covar 행렬 (이 경우 스칼라, ) 에 사용되며 는 고정 및 해당 군집의 랜덤을 고려한 잔차 분산 의 var-covar 행렬에 사용됩니다 효과. 일반적으로 의 대각 행렬로 생각됩니다 . 또한, 두 dist는 다변량 정규 w / 평균 = 0으로 생각됩니다. Yi=β0+β1X+bi+εibiεiGσb2Riεiσ2
gung-복원 모니카

답변:


8

아래에 내 의견을 의견으로 게시하고 싶지만 이것으로는 충분하지 않습니다. 이것은 답변이 아닌 질문입니다 (@gung과 비슷하게 주제에 대해 충분히 강하지 않습니다).

MCMCglmm이 "true"Bayesian glmm을 구현하지 않는다는 인상을 받고 있습니다. 실제 베이지안 모델은 이 백서의 섹션 2에 설명되어 있습니다. 잦은 모델과 유사하게 가지며 , 고정 된 매개 변수 및 "G"분산 외에 분산 매개 변수 에 대한 사전 요구 사항이 있습니다. 랜덤 효과 .g(E(yu))=Xβ+Zuϕ1βu

그러나이 MCMCglmm 비네팅 에 따르면 MCMCglmm 에서 구현 된 모델은 로 주어지며 분산 매개 변수 과는 관련이 없습니다 . 고전적인 잦은 주의자 모델과 비슷하지 않습니다.ϕ 1g(E(yu,e))=Xβ+Zu+eϕ1

따라서 나는 와 이 없다는 것에 놀라지 않을 것 입니다.σe

이 거친 의견에 대해 사과드립니다. 나는 그것에 대해 간단히 살펴 보았습니다.


감사합니다. 이 주제는 매우 어렵 기 때문에 어려운가요? 나는 지금 R과 G 구조의 의미에 만족한다고 생각합니다. 나는 아직도의 부족에 대해 혼란 스러워요 와 나는 당신의 의견에 대해 매우 궁금 진정 베이지안 없습니다. 나는 솔직히 말해서 당신이 연결 한 모든 논문을 이해하고 비 네트의 일부로 고생하고 있지만 순수하게 예제의 관점에서 볼 때 분산 매개 변수 은 일정해야 한다고 생각합니다 . 예는 이항입니다). 내가 무엇을 놓치고 있습니까? ϕ 1σeglmerMCMCglmmMCMCglmmϕ1
Joe King

죄송합니다. 제 말이 완전히 맞지 않았습니다. MCMCglmm은 실제로 베이지안이지만 고전적인 glmm을 정확하게 구현하지는 않습니다 (제 생각에). 또한 잦은 추론에 가까운 분산 성분에 대한 추론을 생성하기 전에 사전 설정이 어렵다는 것을 알아야합니다.
Stéphane Laurent

다시 감사합니다. 내 연구 MCMCglmm에서 다양한 매개 변수 를 사용할 때 분산 성분에 기본 역-유사 예술 분포를 사용할 수 있으며 95 % 신뢰할 수있는 간격에는 항상 랜덤 효과 추정에 대한 분산 값이 포함되어 glmer있으므로 이것이 합리적이라고 느꼈습니다. 그러나 MCMCglmm간격이 예전의 선택에 크게 민감하지 않은 결과 인 경우를 어떻게 해석해야 합니까? 어쩌면 나는 이것에 대해 새로운 질문을해야합니까?
Joe King

아마도 당신은 큰 표본 크기를 가지고 있습니까? 귀하의 초기 질문과 관련하여, 적어도 이항 사례의 경우 글머 모델이 MCMCglmm 모델과 동일하다는 인상을 받고 있습니다 . 에 높은 농도로 설정하면 어떻게됩니까 ? σ eσe=0σe0
Stéphane Laurent

그렇습니다. 샘플 크기가 상당히 큽니다 .225 개의 클러스터에서 50,000 개의 관측치 (제 질문의 예가 ​​아닌 내 데이터). 에서 0 근처에 매우 집중된 사전 을 설정하면 V = 0.01 및 nu = 100을 설정 하여 에 대해 0.25 (CI : 0.16, 0.29)를 대해 0.53 (0.38, 0.73)을 . V = 10 및 nu = 0.01로 덜 유익한 정보를 설정하면 각각 0.18 (0.12, 0.23) 및 0.49 (0.34, 0.63)를 얻습니다. 이것은의 0.51과 비교됩니다 . 나는 심지어 부적절한 플랫을 시도하여 0.10 (0.08, 0.13)과 0.47 (0.25, 0.68)을 얻었습니다. σ e σ uσeσeσuglmer
Joe King

11

나는 게임에 늦었지만 몇 가지 메모가 있습니다. 구조 잔류 구조이다. 귀하의 경우 "구조"에는 단일 요소 만 있습니다 (그러나 반드시 그런 것은 아닙니다). 가우스 반응 변수의 경우 잔차 분산 가 일반적으로 추정됩니다. 이진 결과의 경우 일정하게 유지됩니다. MCMCglmm 설정 방법으로 인해 0으로 고정 할 수는 없지만 로 고정하는 것이 비교적 표준입니다 (프로 빗 모델에도 해당). 카운트 데이터 (예 : 포아송 분포)의 경우이를 수정하지 않으며 기본적으로과 분산 파라미터를 자동으로 추정합니다.σ 2 e 1Rσe21

구조는 랜덤 효과 구조이다. 다시 말하지만, 임의의 가로 채기이지만 여러 개의 임의 효과가있는 경우 분산 공분산 행렬 인 합니다.GGG

마지막으로 잔차 분산은 0으로 고정되어 있지 않으므로 추정값은의 추정값과 일치하지 않습니다 glmer. 크기를 다시 조정해야합니다. 다음은 약간의 예입니다 (임의의 효과를 사용하지 않고 일반화). R 구조 분산이 1로 어떻게 고정되어 있는지 확인하십시오.

# example showing how close the match is to ML without separation
m2 <- MCMCglmm(vs ~ mpg, data = mtcars, family = "categorical",
  prior = list(
    B = list(mu = c(0, 0), V = diag(2) * 1e10),
    R = list(V = 1, fix = 1)),
  nitt = 1e6, thin = 500, burnin = 10000)
summary(m2)

이항식에 대한 크기 조정 상수는 다음과 같습니다.

k <- ((16*sqrt(3))/(15*pi))^2

이제 솔루션을 나누고 사후 모드를 얻으십시오.

posterior.mode(m2$Sol/(sqrt(1 + k)))

우리가 얻는 것과 상당히 비슷해야합니다. glm

summary(glm(vs ~mpg, data = mtcars, family = binomial))

MCMCglmm에서 레벨 1에서 이분산성을 지정하는 방법을 알고 있습니까? 이것이 R 구조입니까? 그러면 구문은 무엇입니까?
Maxim.K

@Joshua, 당신은 "이항 가족에 대한 재조정 상수"를 설명 할 수 있습니까? PS : 시드 123, I는 행 (보정하여) 얻는 m2-8.1640.421; 그리고 glm-8.833에서 0.430.
Qaswed

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.