나는 페이지에서 새로운 통계 및 R에서 아주 새로운. 나는 강의 비와 수위 사이의 상관 관계를 찾는 목표로 대학 프로젝트를 진행하고 있습니다. 상관 관계가 입증되면 예측 / 예측을 원합니다.
데이터는 내가 들어있는 특정 하천 (5 분마다 촬영) 몇 년의 데이터 세트를 가지고 :
- 밀리미터 단위의 강우
- 초당 입방 미터의 강 흐름
이 강에는 눈이 없으므로 모델은 비와 시간을 기준으로합니다. 때로는 온도가 빙결되지만 상황이 내 프로젝트의 범위를 벗어나기 때문에 데이터에서 해당 기간을 이상치로 제거하려고 생각합니다.
예제 여기 몇 시간 후에 비와 물의 상승으로 인한 몇 가지 샘플 데이터 플롯이 있습니다.
빨간 선은 강 흐름입니다. 오렌지는 비입니다. 강에서 물이 솟기 전에 항상 비가 오는 것을 볼 수 있습니다. 시계열이 끝나면 다시 비가 내리지 만 나중에는 강의 흐름에 영향을 미칩니다.
상관 관계가 있습니다. 다음은 R에서 ccf를 사용하여 상관 관계를 증명하기 위해 R에서 수행 한 작업입니다.
- 상호 상관
- 주요 변수
- 시차
이것은 두 번째 예 (한 강우 기간)에 사용 된 내 R 라인입니다.
ccf(arnoiaex1$Caudal, arnoiaex1$Precip, lag.max=1000, plot=TRUE, main="Flow & Rain")
내 해석은 다음과 같습니다
- 비가 먼저옵니다 (먼저 일어난다).
ccf
내가 맞아?
시계열에 대하여 . 이 시계열에는 주기성 또는 계절성이 없습니다. 비는 언제든지 올 수 있으며 효과가 있습니다. 여름에는 줄어들지 만 여전히 발생합니다. 일년 내내 비가 많이 내리는 지역입니다.
모형과 예측.
비가 내린 후 강의 양이 얼마나 증가하는지 알려주는 예측을 수행 할 수있는 모델을 만드는 방법을 모르겠습니다. 나는 몇 가지 시도를하고 있어요 arima
, auto arima
하지만 매우 성공적으로되지 않았습니다. 내가 사용 하는가 Arima
, vars
또는 기타 다른 다변량 모델? 예제에 대한 링크는 큰 도움이 될 것입니다.
이 예측을 만드는 가장 좋은 방법을 알고 있다면 어떤 모델을 사용해야하는지 알려주세요. 내가 고려하고있는 몇 가지 다른 것들이 있지만 단순화를 위해이 설명에서 제외했습니다. 필요한 경우 일부 데이터를 공유 할 수 있습니다.