다중 시계열을 사용하는 RNN


14

각 시리즈의 유형에 따라 훈련하기 위해 시계열을 입력으로 사용하여 신경망을 만들려고합니다. RNN을 사용하면 입력을 배치로 나누고 시계열의 모든 지점을 개별 뉴런으로 사용하여 결국 네트워크를 훈련시킬 수 있다는 것을 읽었습니다.

그래도 내가하려고하는 것은 다중 시계열을 입력으로 사용하는 것입니다. 예를 들어 두 개의 센서에서 입력을받을 수 있습니다. (그래서 두 시계열), 나는 최종 결과를 얻기 위해 두 가지를 모두 사용하고 싶습니다.

또한 시계열의 미래 값을 예측하려고하지 않고 모든 값을 기반으로 분류를 얻으려고합니다.

이 문제에 어떻게 접근해야합니까?

  • RNN에 대한 입력으로 여러 시계열을 사용하는 방법이 있습니까?

  • 시계열을 하나로 통합해야합니까?

  • 아니면 두 개의 다른 신경망을 사용해야합니까? 마지막 접근 방식이 맞다면 시계열 수가 증가해도 컴퓨터 집약적이지 않습니까?

답변:


10

다변량 시계열은 주제를 다루는 많은 최신 논문을 찾을 수있는 활발한 연구 주제입니다.

질문에 대답하기 위해 단일 RNN을 사용할 수 있습니다. 각 시간 단계마다 하나의 값을 입력 할 수 있습니다. 각 단계마다 다른 값을 추가하지 않아도됩니다 (센서가 동기화 된 경우). 그런 다음 모델은 2 차원 시계열로 분류하는 방법을 학습합니다.

이 블로그를 확인 하십시오 . 귀하의 경우에는 출력 만 다릅니다.

마지막 두 지점에 대해서는 시계열을 하나로 집계하는 것은 프로세스 중에 중요한 정보를 잃을 수 있다는 점에서 위험합니다. 마지막으로 마지막 포인트의 주요 단점은 최종 분류에 두 시계열 간의 잠재적 상관 관계를 사용할 수 없다는 것입니다.


다중 시계열을 사용하는 경우 샘플 1의 경우 5 개의 시리즈가 있지만 샘플 2의 경우 4 개가있는 경우 (마지막 센서의 데이터가 없기 때문에) 네트워크가 어떻게 반응합니까? 5 시리즈로 시작하는 경우 항상 5 여야합니까? 가짜 평균 데이터로 sample2에 5 번째 시계열을 포함시켜야합니까?
Ploo

1
데이터 손실에 대한 다른 접근 방식이 있습니다. 값이 없을 때 값 0을 사용하는 것이 좋습니다. 전체 시퀀스 X_t가 없지만 여전히 길이 t의 시퀀스를 입력해야 할 때 사용됩니다. 이에 대해 더 알고 싶다면 패딩이라고합니다.
Daerken
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.