현재 시계열 데이터 (매월 데이터)를 예측하는 프로젝트를 진행하고 있습니다. R을 사용하여 예측을 수행하고 있습니다. 1 개의 종속 변수 (y)와 3 개의 독립 변수 (x1, x2, x3)가 있습니다. y 변수에는 73 개의 관측치가 있으며 다른 3 개의 변수도 있습니다 (alos 73). 2009 년 1 월부터 2015 년 1 월까지 상관 관계와 p- 값을 확인했으며 모델에 적용하는 것이 중요합니다. 내 질문은 : 모든 독립 변수를 사용하여 어떻게 좋은 예측을 할 수 있습니까? 이 변수에 대한 미래 값이 없습니다. 2 년 동안 (2017 년) 내 y 변수가 무엇인지 예측하고 싶다고 가정 해 봅시다. 어떻게해야합니까?
다음 코드를 시도했습니다.
model = arima(y, order(0,2,0), xreg = externaldata)
이 코드로 2 년 동안 y 값을 예측할 수 있습니까?
또한 회귀 코드를 시도했습니다.
reg = lm(y ~ x1 + x2 + x3)
그러나이 코드에서 어떻게 시간을 소비합니까? 내 y 값이 어떻게 초과 될지 어떻게 예측할 수 있습니까? 통계 및 예측이 처음입니다. 지연 값에 대해 약간의 읽기 및 캠을 수행했지만 모델에서 지연 값을 사용하여 예측을 수행하려면 어떻게해야합니까?
실제로 내 전반적인 질문은 미래 가치가없는 외부 변수로 시계열 데이터를 어떻게 예측할 수 있습니까?