R의 다변량 시계열. 지연된 상관 관계를 찾고 예측을위한 모델을 만드는 방법


16

나는 페이지에서 새로운 통계 및 R에서 아주 새로운. 나는 강의 비와 수위 사이의 상관 관계를 찾는 목표로 대학 프로젝트를 진행하고 있습니다. 상관 관계가 입증되면 예측 / 예측을 원합니다.

데이터는 내가 들어있는 특정 하천 (5 분마다 촬영) 몇 년의 데이터 세트를 가지고 :

  • 밀리미터 단위의 강우
  • 초당 입방 미터의 강 흐름

이 강에는 눈이 없으므로 모델은 비와 시간을 기준으로합니다. 때로는 온도가 빙결되지만 상황이 내 프로젝트의 범위를 벗어나기 때문에 데이터에서 해당 기간을 이상치로 제거하려고 생각합니다.

예제 여기 몇 시간 후에 비와 물의 상승으로 인한 몇 가지 샘플 데이터 플롯이 있습니다.

며칠 더 큰 예

단 하나의 강우 기간의 짧은 예

빨간 선은 강 흐름입니다. 오렌지는 비입니다. 강에서 물이 솟기 전에 항상 비가 오는 것을 볼 수 있습니다. 시계열이 끝나면 다시 비가 내리지 만 나중에는 강의 흐름에 영향을 미칩니다.

상관 관계가 있습니다. 다음은 R에서 ccf를 사용하여 상관 관계를 증명하기 위해 R에서 수행 한 작업입니다.

  • 상호 상관
  • 주요 변수
  • 시차

이것은 두 번째 예 (한 강우 기간)에 사용 된 내 R 라인입니다.

ccf(arnoiaex1$Caudal, arnoiaex1$Precip, lag.max=1000, plot=TRUE, main="Flow & Rain")

작은 예제 2에 대한 ccf 결과

내 해석은 다음과 같습니다

  • 비가 먼저옵니다 (먼저 일어난다).
  • 450
  • 450800ccf

내가 맞아?

시계열에 대하여 . 이 시계열에는 주기성 또는 계절성이 없습니다. 비는 언제든지 올 수 있으며 효과가 있습니다. 여름에는 줄어들지 만 여전히 발생합니다. 일년 내내 비가 많이 내리는 지역입니다.

모형과 예측. 비가 내린 후 강의 양이 얼마나 증가하는지 알려주는 예측을 수행 할 수있는 모델을 만드는 방법을 모르겠습니다. 나는 몇 가지 시도를하고 있어요 arima, auto arima하지만 매우 성공적으로되지 않았습니다. 내가 사용 하는가 Arima, vars또는 기타 다른 다변량 모델? 예제에 대한 링크는 큰 도움이 될 것입니다.

이 예측을 만드는 가장 좋은 방법을 알고 있다면 어떤 모델을 사용해야하는지 알려주세요. 내가 고려하고있는 몇 가지 다른 것들이 있지만 단순화를 위해이 설명에서 제외했습니다. 필요한 경우 일부 데이터를 공유 할 수 있습니다.


당신은 개입 분석을 찾고 있습니다 (사회 연구에서 서브 세트는 "이벤트 연구"라고 불림)
Konstantinos

답변:


3

ACF 및 PACF 비헤이비어를 사용하여 데이터에 더 적합한 모델을 결정하는 데 도움이됩니다 (예 : ACF 플롯에서 느리게 감소하는 경우 계열을보다 안정적으로 만드는 데 차이가 필요할 수 있음을 나타냅니다. 올바른 변형을 사용하는 경우 변동이 적고 파란색 선 안에 있어야합니다 (고정 시리즈). 고정 시리즈를 만든 후에는 AR, MA, ARMA 또는 ARIMA 모델이 적합한 지 생각해보십시오. 내 프로젝트에서 모델 선택을 돕기 위해 다음을 수행했습니다.

ACF 플롯은 지연 2에서 상대적으로 큰 값을 나타냅니다 (플롯의 위치 참조 ). 그 외에도 2보다 큰 시차에서 본질적으로 0이됩니다. 이것은 MA (2) 모델이 데이터에 적합 할 수 있고 PACF 플롯을 보면 상관 관계가 거의 모든 지연에서 0임을 즉시 알 수 있습니다. 이것은 모델에 AR 부분이 없다는 것을 암시 할 수 있습니다 ( 플롯에 맞게 조정하십시오)). 따라서 후보 모델 중 하나는 매개 변수 p = 0, d = 1 및 q = 1 or2 인 ARIMA (p, d, q) 일 수 있습니다. 나는 또한 MA의 더 높은 차수를 시도하고 AIC, AICc 및 BIC의 결과를 비교하고 최종 모델을 결정하기 위해 모델에 AR 부분을 가질 가능성을 고려했습니다. 다음 단계에서는 올바른 모델을 선택하고 잔차에 패턴이 없는지 확인하기 위해 몇 가지 진단 테스트를 수행해야합니다 (잔차에 대한 ACF 및 PACF, Ljung-Box 통계의 p- 값, 잔차에 대한 히스토그램 및 QQ 플롯). 그것이 도움이되기를 바랍니다!

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.