선형 혼합 모형의 임의 효과에 대한 모형 선택에 대한 다양한 설명은 REML을 사용하도록 지시합니다. 일부 수준에서 REML과 ML의 차이점을 알고 있지만 ML이 바이어스되어 REML을 사용해야하는 이유를 이해하지 못합니다. 예를 들어 ML을 사용하여 정규 분포 모형의 분산 모수에 대해 LRT를 수행하는 것이 잘못 되었습니까 (아래 코드 참조)? 모델 선택에서 ML보다 편견이 더 중요한 이유를 이해하지 못합니다. 궁극적 인 대답은 "모델 선택이 ML보다 REML에서 더 잘 작동하기 때문"이어야한다고 생각하지만 그보다 조금 더 알고 싶습니다. 나는 LRT와 AIC의 파생물을 읽지 못했지만 (완전히 이해하기에는 충분하지 않습니다), REML이 파생물에서 명시 적으로 사용되는 경우 실제로 충분하다는 것을 알면 (예 :
n <- 100
a <- 10
b <- 1
alpha <- 5
beta <- 1
x <- runif(n,0,10)
y <- rnorm(n,a+b*x,alpha+beta*x)
loglik1 <- function(p,x,y){
a <- p[1]
b <- p[2]
alpha <- p[3]
-sum(dnorm(y,a+b*x,alpha,log=T))
}
loglik2 <- function(p,x,y){
a <- p[1]
b <- p[2]
alpha <- p[3]
beta <- p[4]
-sum(dnorm(y,a+b*x,alpha+beta*x,log=T))
}
m1 <- optim(c(a,b,alpha),loglik1,x=x,y=y)$value
m2 <- optim(c(a,b,alpha,beta),loglik2,x=x,y=y)$value
D <- 2*(m1-m2)
1-pchisq(D,df=1) # p-value