시계열에 대한 예측을 제공하는 혼합 효과 모델 (사실 일반화 첨가제 혼합 모델)이 있습니다. 자기 상관에 대응하기 위해 데이터가 누락되었다는 사실을 감안할 때 corCAR1 모델을 사용합니다. 데이터는 총로드를 제공해야하므로 전체 예측 간격을 합산해야합니다. 그러나 그 총 부하에 대한 표준 오차의 추정치를 얻어야합니다.
모든 예측이 독립적이라면 다음과 같이 쉽게 해결할 수 있습니다.
및 V a r ( E [ X i ] ) = S E ( E [ X i) ] ) 2
문제는 예측 값이 모델에서 나오고 원래 데이터에 자기 상관이 있다는 것입니다. 전체 문제는 다음과 같은 질문으로 이어집니다.
- 계산 된 예측의 SE가 해당 예측의 예상 값에 대한 분산의 근본으로 해석 될 수 있다고 가정하면 정확합니까? 나는 예측을 "평균 예측"으로 해석하는 경향이 있으므로 전체 수단을 합한 것이다.
- 이 문제에서 자기 상관을 어떻게 통합합니까, 아니면 결과에 큰 영향을 미치지 않을 것이라고 안전하게 가정 할 수 있습니까?
이것은 R의 예입니다. 실제 데이터 세트의 측정 값은 약 34.000이므로 확장성에 문제가 있습니다. 그것이 제가 매월 자기 상관을 모델링하는 이유입니다. 그렇지 않으면 더 이상 계산이 불가능합니다. 가장 정확한 해결책은 아니지만 가장 올바른 해결책은 아닙니다.
set.seed(12)
require(mgcv)
Data <- data.frame(
dates = seq(as.Date("2011-1-1"),as.Date("2011-12-31"),by="day")
)
Data <- within(Data,{
X <- abs(rnorm(nrow(Data),3))
Y <- 2*X + X^2 + scale(Data$dates)^2
month <- as.POSIXlt(dates)$mon+1
mday <- as.POSIXlt(dates)$mday
})
model <- gamm(Y~s(X)+s(as.numeric(dates)),correlation=corCAR1(form=~mday|month),data=Data)
preds <- predict(model$gam,se=T)
Total <- sum(preds$fit)
편집하다 :
배우기 : 먼저 당황하기 전에 모든 도움말 파일의 모든 샘플을 살펴보십시오. predict.gam의 도움말 파일에서 다음을 찾을 수 있습니다.
#########################################################
## now get variance of sum of predictions using lpmatrix
#########################################################
Xp <- predict(b,newd,type="lpmatrix")
## Xp %*% coef(b) yields vector of predictions
a <- rep(1,31)
Xs <- t(a) %*% Xp ## Xs %*% coef(b) gives sum of predictions
var.sum <- Xs %*% b$Vp %*% t(Xs)
내가하고 싶은 것에 가깝습니다. 이것은 여전히 그것이 어떻게 수행되는지 정확하게 알려주지 않습니다. 선형 예측 변수를 기반으로한다는 사실까지 알 수 있습니다. 모든 통찰력은 여전히 환영합니다.