, 예측 기간 동안 시뮬레이션


18

시계열 데이터가 있고 데이터에 맞게 를 모델로 사용했습니다. (필자는 드문 경우를 볼 때) (I 드문 이벤트가 표시되지 않는 경우) 또는 1 0 중 하나 인 지표 확률 변수이다. 에 대한 이전 관찰 결과를 기반으로 Variable Length Markov Chain 방법을 사용하여 대한 모델을 개발할 수 있습니다 . 이를 통해 예측 기간 동안 를 시뮬레이션하고 0과 1의 시퀀스를 제공합니다. 이것은 드문 이벤트이므로 자주 표시되지 않습니다 . 에 대한 시뮬레이션 된 값을 기반으로 예측 간격을 예측하고 얻을 수 있습니다 . X tARIMA(p,d,q)+XtXtX t X t X t = 1 X tXtXtXtXt=1Xt

질문:

예측 기간 동안 시뮬레이션 된 에서 1의 발생을 고려하기 위해 효율적인 시뮬레이션 절차를 어떻게 개발할 수 있습니까? 평균과 예측 간격을 얻어야합니다. Xt

1을 관찰 할 확률은 너무 작아서이 경우에는 일반적인 Monte Carlo 시뮬레이션이 잘 작동한다고 생각할 수 없습니다. 아마도 "중요도 샘플링"을 사용할 수는 있지만 정확히 어떻게 확신 할 수는 없습니다.

감사합니다.


6
여러분, 제 질문의 제목과 본문을 너무 많이 바꾸지 마십시오! "혼합"과 "가변 길이 마르코프 체인"은 제 질문이 아닙니다. 문제는 예측 및 시뮬레이션에 관한 것입니다. 질문하는 방법을 결정하도록 해주세요 ...
Stat

귀하의 질문에 Arima 구성 요소의 중요성은 무엇입니까? 질문과 전혀 관련이없는 것 같습니다.
mpiktas

또 다른 생각은, 확률 이 매우 낮 으면, 비해 의 예측 구간 은 커버리지 확률 가질 것이다 . 그렇다면 예측 간격이 귀하의 경우에 그렇게 유용하지 않습니까? 또한 모델에 대해 이면 부분이 를 지배합니다 . X t = 0 [ 0 , 0 ] 1 - p d > 0 A R I M A ( p , d , q ) A R I M A ( p , d , q ) X tP(Xt=1)=pXt=0[0,0]1pd>0ARIMA(p,d,q)ARIMA(p,d,q)Xt
mpiktas

@ mpiktas : 의견 주셔서 감사합니다. Arima는 내 질문에서 실제로 중요합니다. "[0,0]의 예측 간격"은 무엇을 의미합니까? 이 경우에도 예측 간격이 유용하다고 생각합니다. I 가지고 의 그러나 효과 피팅 값 위에 현저하다. 예상 기간 동안에도 는 자체 효과가 있습니다. X t A R I M A ( p , d , q ) X td>0XtARIMA(p,d,q)Xt
통계

답변:


0

먼저 우리는 더 일반적인 경우를 고려합니다. 하자 여기서 및 . 다음의 지원 가정 의 하나의 지배 과 존재 아래의 모든 적분을, 우리는이 : A f A ( ) X f X ( ) g x ( ) f X ( ) P ( Y y ) = E f A , f X [ I ( Y y ) ] = E f X [ E f AY=Y(A,X)AfA()XfX()gx()fX()

P(Yy)=EfA,fX[I(Yy)]=EfX[EfA[I(Yy)X]]=supp(fX)EfA[I(Yy)X=x]fX(x)dx=supp(fX)EfA[I(Yy)X=x]fX(x)gX(x)gX(x)dx=supp(gX)EfA[I(Yy)fX(X)gX(X)X=x]gX(x)dx=EgX[EfA[I(Yy)fX(X)gX(X)X]]=EfA,gX[I(Yy)fX(X)gX(X)]

귀하의 경우 및 과 같이 정의 될 수 따라서 분포 를 통해 를 시뮬레이션 할 수 있지만 모든 관측 값 의 가중치는 이고 모든 관측 값 의 가중치는 . ARIMA 프로세스의 시뮬레이션은 영향을받지 않습니다. g X ( ) g X ( x ) = { 0.5 x = 1 0.5 x = 0 X g X ( ) X = 1 p

fX(x)={px=11px=0
gX()
gX(x)={0.5x=10.5x=0
XgX()X=1X=01pp0.5=2pX=01p0.5=2(1p)
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.