시계열의 혼합 효과 모델에서 예측 된 값의 합계에 대한 편차


32

시계열에 대한 예측을 제공하는 혼합 효과 모델 (사실 일반화 첨가제 혼합 모델)이 있습니다. 자기 상관에 대응하기 위해 데이터가 누락되었다는 사실을 감안할 때 corCAR1 모델을 사용합니다. 데이터는 총로드를 제공해야하므로 전체 예측 간격을 합산해야합니다. 그러나 그 총 부하에 대한 표준 오차의 추정치를 얻어야합니다.

모든 예측이 독립적이라면 다음과 같이 쉽게 해결할 수 있습니다.

V a r ( E [ X i ] ) = S E ( E [ X i) ] ) 2V에이아르 자형(나는=1이자형[엑스나는])=나는=1V에이아르 자형(이자형[엑스나는])V에이아르 자형(이자형[엑스나는])=에스이자형(이자형[엑스나는])2

문제는 예측 값이 모델에서 나오고 원래 데이터에 자기 상관이 있다는 것입니다. 전체 문제는 다음과 같은 질문으로 이어집니다.

  1. 계산 된 예측의 SE가 해당 예측의 예상 값에 대한 분산의 근본으로 해석 될 수 있다고 가정하면 정확합니까? 나는 예측을 "평균 예측"으로 해석하는 경향이 있으므로 전체 수단을 합한 것이다.
  2. 이 문제에서 자기 상관을 어떻게 통합합니까, 아니면 결과에 큰 영향을 미치지 않을 것이라고 안전하게 가정 할 수 있습니까?

이것은 R의 예입니다. 실제 데이터 세트의 측정 값은 약 34.000이므로 확장성에 문제가 있습니다. 그것이 제가 매월 자기 상관을 모델링하는 이유입니다. 그렇지 않으면 더 이상 계산이 불가능합니다. 가장 정확한 해결책은 아니지만 가장 올바른 해결책은 아닙니다.

set.seed(12)
require(mgcv)

Data <- data.frame(
    dates = seq(as.Date("2011-1-1"),as.Date("2011-12-31"),by="day")
)

Data <- within(Data,{
X <- abs(rnorm(nrow(Data),3))
Y <- 2*X + X^2 + scale(Data$dates)^2
month <- as.POSIXlt(dates)$mon+1
mday <- as.POSIXlt(dates)$mday
})

model <- gamm(Y~s(X)+s(as.numeric(dates)),correlation=corCAR1(form=~mday|month),data=Data)

preds <- predict(model$gam,se=T)

Total <- sum(preds$fit)

편집하다 :

배우기 : 먼저 당황하기 전에 모든 도움말 파일의 모든 샘플을 살펴보십시오. predict.gam의 도움말 파일에서 다음을 찾을 수 있습니다.

#########################################################
## now get variance of sum of predictions using lpmatrix
#########################################################

Xp <- predict(b,newd,type="lpmatrix") 

## Xp %*% coef(b) yields vector of predictions

a <- rep(1,31)
Xs <- t(a) %*% Xp ## Xs %*% coef(b) gives sum of predictions
var.sum <- Xs %*% b$Vp %*% t(Xs)

내가하고 싶은 것에 가깝습니다. 이것은 여전히 ​​그것이 어떻게 수행되는지 정확하게 알려주지 않습니다. 선형 예측 변수를 기반으로한다는 사실까지 알 수 있습니다. 모든 통찰력은 여전히 ​​환영합니다.


6
V에이아르 자형(나는이자형[엑스나는])=에이V에이아르 자형(이자형[엑스])에이
에이V에이아르 자형(이자형[엑스])이자형[엑스]=(이자형[엑스1],,이자형[엑스])

@probabilityislogic 기본적으로 r 프로그램이 수행하는 작업입니다. 수학을위한 Thx
Joris Meys

2
@probabilityislogic 당신이 그것을 답변으로 포장 할 수 있다면, 당신은 내 +50 현상금을 얻을 수 있습니다. ;)
e-sushi

이자형(엑스나는)=μ나는나는=1V에이아르 자형(이자형[엑스나는])=0

@ user52220 여기가 잘못되었습니다. E (Xi)는 예상 값이므로 임의 변수 인 반면 mu_i는 모집단의 평균이므로 고정 된 숫자입니다. Var (mu) = 0이지만 E (Xi)에 대해서도 동일하지 않습니다.
Joris Meys

답변:


1

행렬 표기법에서 혼합 모형은 다음과 같이 나타낼 수 있습니다.

y = X * 베타 + Z * u + 엡실론

여기서 X 및 Z는 각각 고정 효과 및 랜덤 효과 관찰과 관련된 알려진 설계 행렬입니다.

첫 관측 값의 상실을 포함하는 자동 상관을 수정하고 [y1, y2, ... yn]의 열 벡터를 1 씩 작게 바꾸는 단순하고 적절한 (최선은 아니지만) 변환을 적용합니다. 관측 열 벡터, 즉 : [y2-rho * y1, y3-rho * y2, ..., yn-rho * y (n-1)]. 여기서 rho는 직렬 자동 상관에 대한 추정값입니다.

이것은 행렬 T를 곱하여 T * y를 형성함으로써 수행 될 수 있으며, 여기서 T의 1 행은 [-rho, 1, 0, 0, ....], 2 행 : [0, -rho, 1, 0, 0, ...] 등. 다른 디자인 행렬도 T * X 및 T * Z로 변경됩니다. 또한 오차항의 분산-공분산 행렬도 독립적 인 오차항으로 변경됩니다.

이제 새로운 설계 행렬로 솔루션을 계산하십시오.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.