내가 다루고있는 문제는 시계열 값을 예측하는 것입니다. 한 번에 하나의 시계열을보고 있으며 입력 데이터의 15 %를 기준으로 미래 값을 예측하고 싶습니다. 지금까지 나는 두 가지 모델을 보았습니다.
- LSTM (장기 단기 기억, 반복 신경망의 클래스)
- 아리마
나는 둘 다 시도하고 그들에 대한 기사를 읽었습니다. 이제 두 가지를 비교하는 방법에 대해 더 잘 이해하려고합니다. 내가 지금까지 찾은 것 :
- 대량의 데이터를 처리하고 충분한 교육 데이터를 사용할 수있는 경우 LSTM이 더 잘 작동하지만 ARIMA는 더 작은 데이터 세트에 더 좋습니다 (정확합니까?).
- ARIMA에는
(p,q,d)
데이터를 기반으로 계산해야하는 일련의 매개 변수 가 필요하지만 LSTM에서는 이러한 매개 변수를 설정할 필요가 없습니다. 그러나 LSTM에 맞게 조정해야하는 일부 하이퍼 파라미터가 있습니다. - 편집 : 여기서 훌륭한 기사를 읽는 동안 주목 한 두 가지 주요 차이점은 ARIMA는 고정 시계열 (계절, 추세 등이없는 경우)에서만 잘 수행 할 수 있으며 다음과 같은 경우 처리해야한다는 것입니다 ARIMA를 사용하고 싶습니다
위에서 언급 한 속성 이외에도 최고의 모델을 선택하는 데 도움이되는 다른 요점이나 사실을 찾을 수 없었습니다. 누군가가 기사, 논문 또는 기타 물건을 찾는 데 도움을 줄 수 있다면 정말 감사 할 것입니다 (지금까지 운이 없었으며 여기저기서 일반적인 의견 만 있고 실험에 근거한 것은 없습니다).
원래 스트리밍 데이터를 다루고 있다고 언급해야하지만 지금 은 최대 크기가 20k 데이터 포인트 인 50 개의 데이터 세트 가 포함 된 NAB 데이터 세트를 사용하고 있습니다.