ARIMA vs LSTM을 사용한 시계열 예측


10

내가 다루고있는 문제는 시계열 값을 예측하는 것입니다. 한 번에 하나의 시계열을보고 있으며 입력 데이터의 15 %를 기준으로 미래 값을 예측하고 싶습니다. 지금까지 나는 두 가지 모델을 보았습니다.

  • LSTM (장기 단기 기억, 반복 신경망의 클래스)
  • 아리마

나는 둘 다 시도하고 그들에 대한 기사를 읽었습니다. 이제 두 가지를 비교하는 방법에 대해 더 잘 이해하려고합니다. 내가 지금까지 찾은 것 :

  1. 대량의 데이터를 처리하고 충분한 교육 데이터를 사용할 수있는 경우 LSTM이 더 잘 작동하지만 ARIMA는 더 작은 데이터 세트에 더 좋습니다 (정확합니까?).
  2. ARIMA에는 (p,q,d)데이터를 기반으로 계산해야하는 일련의 매개 변수 가 필요하지만 LSTM에서는 이러한 매개 변수를 설정할 필요가 없습니다. 그러나 LSTM에 맞게 조정해야하는 일부 하이퍼 파라미터가 있습니다.

위에서 언급 한 속성 이외에도 최고의 모델을 선택하는 데 도움이되는 다른 요점이나 사실을 찾을 수 없었습니다. 누군가가 기사, 논문 또는 기타 물건을 찾는 데 도움을 줄 수 있다면 정말 감사 할 것입니다 (지금까지 운이 없었으며 여기저기서 일반적인 의견 만 있고 실험에 근거한 것은 없습니다).

원래 스트리밍 데이터를 다루고 있다고 언급해야하지만 지금 은 최대 크기가 20k 데이터 포인트 인 50 개의 데이터 세트 가 포함 된 NAB 데이터 세트를 사용하고 있습니다.


1
데이터의 일부에 대해 두 가지 모델을 시도하고 예측에 더 적합한 모델을 확인한 후 선택하십시오. 또는 두 모델을 모두 사용하고 예측을 결합하십시오. 예측 조합은 종종 개별 예측보다 성능이 뛰어납니다.
Richard Hardy

@RichardHardy 나는 이미 그 일을했으며 내 데이터 세트에서의 성능을 알고 있습니다. 나는 다가오는 데이터 샘플을 처리하기에 가장 적합한 후보를 확인하기 위해 두 가지, 특히 단점을 더 잘 이해하려고합니다.
ahajib


도움말 센터 , 특히 "세 번째 사이트에는 교차 게시를 권장하지 않습니다. "라는 세 번째 마지막 단락을 읽으십시오 . 질문을 게시 할 최상의 위치를 ​​하나 선택하십시오. 나중에 더 적합한 경우 다른 사이트, 그것은 마이그레이션 할 수 있습니다. "
Glen_b -Reinstate 모니카에게

답변:


3

원자재 가격 예측을위한 인공 신경망과 시계열 모델의 비교는 재무 시계열 예측에서 ANN과 ARIMA의 성능을 비교합니다. 나는 그것이 당신의 문헌 검토를위한 좋은 출발점이라고 생각합니다.

대부분의 경우 신경망은 AR 기반 모델보다 성능이 뛰어납니다. 그러나 고급 머신 러닝 방법의 한 가지 큰 단점 (학술 분야에서는 그다지 논의되지 않음)은 블랙 박스를 사용하는 것입니다. 이러한 모델을 잘 모르는 사람 (예 : 회사)에서 모델이 어떻게 작동하는지 설명해야하는 경우 이는 큰 문제입니다. 그러나 만약 당신이 학교 일과 같이이 분석을하고 있다면 이것이 문제가되지 않을 것이라고 생각합니다.

그러나 이전 주석가가 말했듯이 일반적으로 가장 좋은 방법은 두 개 이상의 모델을 결합하는 앙상블 추정기를 구성하는 것입니다.


7
당신이 언급 한 심판은 단순한 피드 포워드 신경망을 다루며 너무 오래되어 유용하지 않습니다 (1990 년대는 세기 전). OP 질문은 LSTM 아키텍처를 사용한 재귀 신경망에 관해 묻지 만이 백서에서는 다루지 않습니다.
horaceT

1
@horaceT가 언급 했듯이이 논문은 약간 구식이며 LSTM에 대한 정보가 포함 된 최신 논문을 제안 할 수 있다면 좋을 것입니다. 감사합니다
ahajib
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.