중첩 된 var-covar 모델 중에서 선택하기 위해 ML 대신 REML을 사용해야하는 이유는 무엇입니까?


16

선형 혼합 모형의 임의 효과에 대한 모형 선택에 대한 다양한 설명은 REML을 사용하도록 지시합니다. 일부 수준에서 REML과 ML의 차이점을 알고 있지만 ML이 바이어스되어 REML을 사용해야하는 이유를 이해하지 못합니다. 예를 들어 ML을 사용하여 정규 분포 모형의 분산 모수에 대해 LRT를 수행하는 것이 잘못 되었습니까 (아래 코드 참조)? 모델 선택에서 ML보다 편견이 더 중요한 이유를 이해하지 못합니다. 궁극적 인 대답은 "모델 선택이 ML보다 REML에서 더 잘 작동하기 때문"이어야한다고 생각하지만 그보다 조금 더 알고 싶습니다. 나는 LRT와 AIC의 파생물을 읽지 못했지만 (완전히 이해하기에는 충분하지 않습니다), REML이 파생물에서 명시 적으로 사용되는 경우 실제로 충분하다는 것을 알면 (예 :

n <- 100
a <- 10
b <- 1
alpha <- 5
beta <- 1
x <- runif(n,0,10)
y <- rnorm(n,a+b*x,alpha+beta*x)

loglik1 <- function(p,x,y){
   a <- p[1]
   b <- p[2]
   alpha <- p[3]
  -sum(dnorm(y,a+b*x,alpha,log=T))
}

loglik2 <- function(p,x,y){
   a <- p[1]
   b <- p[2]
   alpha <- p[3]
   beta <- p[4]
  -sum(dnorm(y,a+b*x,alpha+beta*x,log=T))
}

m1 <- optim(c(a,b,alpha),loglik1,x=x,y=y)$value
m2 <- optim(c(a,b,alpha,beta),loglik2,x=x,y=y)$value
D <- 2*(m1-m2)
1-pchisq(D,df=1) # p-value

1
REML 및 AIC에 대해서는 이 질문을 살펴 봐야 합니다.
Elvis

답변:


13

매우 짧은 대답 : REML은 ML이므로 REML 기반 테스트는 어쨌든 정확합니다. REML을 사용한 분산 매개 변수의 추정이 더 좋으므로이를 사용하는 것이 당연합니다.

REML이 ML 인 이유는 무엇입니까? 예 모델 고려 X R N × P는 , Z R N × Qβ R (P)는 고정 효과 벡터이고 U ~ N ( 0 , τ I에서 Q가 ) 는 랜덤 효과의 벡터이며 e N ( 0 , σ 2 I n

Y=Xβ+Zu+e
XRn×pZRn×qβRpuN(0,τIq)eN(0,σ2In). 고정 된 효과를 "제거"하기 위해 대비를 고려하여 제한 가능성을 얻을 수 있습니다 . 보다 정확하게 할 수 C R ( N - ) × N 되도록, C X = 0C C ' = I N - P 이다 (의 열 C는 ' 받는 벡터 공간 orthognal의 정규직 교 기저있다 X 의 열에 의해 생성 된 공간 ); 그런 다음 C Y = C Z unpCR(np)×nCX=0CC=InpCX ε ~ N (는 제한된 우도이다.
CY=CZu+ϵ
, C Y가 주어진 τ , σ 2 가능성ϵN(0,σ2Inp)τ,σ2CY

좋은 대답 (+1), 행렬 가 평균 모델에 의존 한다고 말하는 것이 맞 습니까? 따라서 동일한 C 행렬에 대한 REML 추정값 만 비교할 수 있습니까? CC

예, X에 의존합니다 (분명히 대답을 수정하기 위해 답변을 수정하겠습니다). 중첩 된 모델에는 고정 효과를 가진 동일한 변수가 있어야합니다. CX
Elvis

REML은 하지 ML! ML 고유 소정의 확률 모델에 대해 정의되어 있지만 REML는 고정 효과 파라미터에 의존한다. 예를 들어 Doug Bates (R-SIG-mixed-models의 여러 역사적 자료) 의이 의견 을 참조하십시오 .
Livius

1
@ Livius 제 대답은 제한적 우도가 어떻게 구성되어 있는지 명확하게 충분하다고 생각합니다. 그것은 것이 관찰 주어진 그냥 가능성있어, 우도 제 표시된 식에 기재된 모델에서, 그러나 계획된 벡터 주어진 C Y 번째에 기록 된 모델 방정식을 표시. REML는 이다 우도이 우도에 의한. YCY
Elvis

2
나는 이것이이 문제에 대한 DBates의 항의의 요점이라고 생각한다. 그것은 다른 모델이며, 모델과 매개 변수화가 얽혀 있기 때문에 비교하기 어려운 모델이다. 당신은 계산하지 않을 그래서 원래 모델 ML하지만 에 대한 ML을 다른 모델 원래 모델의 특정 파라미터에서 발생. 따라서 중첩 고정 효과 구조를 가진 REML 적합 모델은 더 이상 중첩 모델이 아닙니다 (위에서 언급 한 것처럼). 그러나 지정된 모형에서 가능성을 최대화하기 때문에 ML 적합 모형은 여전히 ​​중첩됩니다.
Livius

9

우도 비 검정은 두 우도의 비에 기초한 통계적 가설 검정입니다. 그들의 속성은 최대 우도 추정 (MLE)과 관련이 있습니다. (예를 들어 평신도 용어로 최대 가능성 추정치 (MLE) ).

귀하의 경우에는 당신이 '두 개의 중첩 VAR-코발 모델마다'선택 '할 (질문 참조),하자 당신이 VAR-코발이되는 모델 중에서 선택하고 싶은 말은 var에-코발이와 모델이다 Σ 에스ΣgΣs 번째 (간이 형)가 제 1 일 (일반적인 하나)의 특별한 경우이다.

테스트는 우도 비율에 기초 . 어디에 Σ SΣ g 있다 최대 가능성 추정기.LR=2(log(Ls(Σ^s))log(Lg(Σ^g))Σ^sΣ^g

통계량 무증상 (!) χ 2 입니다. LR χ2

최대 우도 추정치는 일관된 것으로 알려져 있지만 많은 경우 편향되어 있습니다. 이는 분산에 MLE 추정기의 경우와 Σ SΣ의 g , 그들이 가압되어 표시 될 수있다. 이는 데이터에서 도출 된 평균을 사용하여 계산되므로이 '추정 평균'주변의 스프레드가 실제 평균 주변의 스프레드보다 작습니다 (예 : 표준 편차를 계산할 때 n - 1로 나누는 직관적 인 설명 참조) ? )Σ^sΣ^gn1

통계 상술이다 χ 2 대규모 샘플이 단지 때문에 사실, 즉 큰 샘플, Σ SΣ gLRχ2Σ^sΣ^g 수렴 그들의 진정한 값 (MLE 일관성).
(참고 : 위 링크에서 매우 큰 샘플의 경우 n 또는 (n-1)으로 나누면 차이가 없습니다.)

작은 샘플의 경우, MLE은의 추정 ΣΣ의 g는 바이어스되며, 따라서의 분포 L R이 됩니다 벗어나지 에서 χ 2 REML 추정에 대한 편견 추정주는 반면, Σ Σ의 g를 사용 그렇다면, var-covar 모델을 선택하기 위해 REML 추정값 은 작은 샘플에 대한 L Rχ 2 로 더 잘 추정됩니다.Σ^sΣ^gLRχ2ΣsΣgLRχ2 .

REML은 평균이 동일한 모델의 중첩 된 var-covar 구조 중에서 선택하는 데만 사용해야합니다. 평균이 다른 모델의 경우 REML이 적합하지 않습니다. 평균이 다른 모델의 경우 ML을 사용해야합니다.


이 경우 "통계 LR은 무의식적으로 (!) χ2"입니다. 경우 때문이다 에 중첩되어 Σ의 g , 다음 Σ 의 경계에있는 Σ의 g . 이 경우 χ 2 분포는 유지되지 않습니다. 예를 들어 여기를 참조 하십시오ΣsΣgΣsΣgχ2
Cliff AB

@Cliff AB, 이것이 그 진술 아래에 설명되어 있으며 REML을 사용해야하는 이유입니다.

-4

통계보다 상식과 관련이있는 답변이 있습니다. SAS에서 PROC MIXED를 살펴보면 6 가지 방법으로 추정을 수행 할 수 있습니다.

http://support.sas.com/documentation/cdl/en/statug/63033/HTML/default/viewer.htm#statug_mixed_sect008.htm

그러나 REML이 기본값입니다. 왜? 실제로, 실제 경험은 최고의 성능 (예를 들어, 수렴 문제가 발생할 가능성이 가장 적은)을 보여주었습니다. 따라서 목표를 REML로 달성 할 수 있으면 다른 5 가지 방법과 달리 REML을 사용하는 것이 좋습니다.


2
그것은 '큰 표본 이론'과 MLE 추정치의 편향과 관련이 있습니다. 내 대답을 참조하십시오.

1
"SAS의 기본값"은이 사이트의 "이유"질문에 대한 대답이 아닙니다.
Paul

SAS에서 기본적으로 제공하는 혼합 모델의 p- 값은 신뢰할 수 없기 때문에 R의 lme4 라이브러리에서 설계 상 사용할 수 없습니다 ( stat.ethz.ch/pipermail/r-help/2006-May/094765.html ). 따라서 "기본 SAS"도 잘못 될 수 있습니다.
Tim
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.