시계열에 대한이 예측이 왜“꽤 열악”합니까?


15

신경망 사용법을 배우려고합니다. 이 튜토리얼 을 읽고있었습니다 .

의 값을 사용하여 t + 1 의 값을 예측 하여 시계열에 신경망을 피팅 한 후 저자는 다음 그림을 얻습니다. 여기서 파란색 선은 시계열, 녹색은 열차 데이터에 대한 예측, 빨간색은 테스트 데이터 예측 (테스트 기차 분할 사용)+1p1

"모델이 훈련 데이터 세트와 테스트 데이터 세트 모두에 적합하지 않은 것으로 나타났습니다. 기본적으로 출력과 동일한 입력 값을 예측했습니다."

그런 다음 저자는 , t - 1t - 2 를 사용하여 t + 1 의 값을 예측 하기로 결정합니다 . 그렇게함으로써12+1

p2

"그래프를 보면 예측에서 더 많은 구조를 볼 수 있습니다."

내 질문

첫 번째 "가난한"이유는 무엇입니까? 그것은 나에게 거의 완벽 해 보이며, 모든 단일 변화를 완벽하게 예측합니다!

마찬가지로, 왜 두 번째가 더 낫습니까? "구조"는 어디에 있습니까? 나에게 그것은 첫 것보다 훨씬 나빠 보인다.

일반적으로 시계열에 대한 예측은 언제 좋으며 언제 나쁜가요?


3
일반적으로 대부분의 ML 방법은 단면 분석을위한 것이며 시계열에 적용 할 조정이 필요합니다. 주된 이유는 데이터의 자기 상관 (autocorrelation)인데, ML에서는 종종 가장 인기있는 방법에서 데이터가 독립적 인 것으로 가정합니다.
Aksakal

11
모든 변화를 예측하는 데 큰 도움이됩니다.
hobbs

@ hobbs, 나는 t + 1을 예측하기 위해 t, t-1, t-2 등을 사용하려고하지 않습니다. 과거에 얼마나 많은 용어를 사용하는 것이 가장 좋은지 궁금합니다. 너무 많이 사용하면 과적 합입니까?
Euler_Salter

잔차를 나타내는 것이 더 밝아 졌을 것입니다.
reo katoa

답변:


23

일종의 착시 현상입니다. 눈은 그래프를보고 빨강과 파랑 그래프가 각각 옆에 있습니다. 문제는 그들이 서로 옆에 있다는 것입니다 수평 ,하지만 중요한 것은입니다 수직거리. 눈은 직교 그래프의 2 차원 공간에서 곡선 사이의 거리를 가장 쉽게 볼 수 있지만 중요한 것은 특정 t 값 내의 1 차원 거리입니다. 예를 들어 A1 = (10,100), A2 = (10.1, 90), A3 = (9.8,85), P1 = (10.1,100.1) 및 P2 = (9.8, 88)이 있다고 가정합니다. 눈은 자연스럽게 P1과 A1을 비교할 것입니다. P2가 A2와 비교 될 때 가장 가까운 지점이기 때문입니다. P1은 A2보다 A1에 더 가깝기 때문에 P1은 더 나은 예측처럼 보일 것입니다. 그러나 P1을 A1과 비교할 때 A1이 이전에 본 것을 얼마나 잘 반복 할 수 있는지를보고있을뿐입니다. A1과 관련하여 P1은 예측 이 아닙니다. 적절한 비교는 P1 v. A2와 P2 v. A3 사이이며,이 비교에서 P2는 P1보다 낫습니다. t에 대해 y_actual 및 y_pred를 플로팅하는 것 외에도 t에 대한 (y_pred-y_actual) 그래프가 있다면 더 분명했을 것입니다.


2
다른 사람이 왜 "잘 생긴"예측이 실제로 좋지 않은지 언급하지 않기 때문에 더 나은 대답입니다.
Richard Hardy

17

첫 번째 "가난한"이유는 무엇입니까? 그것은 나에게 거의 완벽 해 보이며, 모든 단일 변화를 완벽하게 예측합니다!

이른바 "이동 된"예측입니다. 차트 1을 자세히 살펴보면 예측력이 거의 마지막으로 본 값만 복사한다는 것을 알 수 있습니다. 즉, 모델이 더 잘 학습하지 못했으며 시계열을 임의의 보행으로 취급합니다. 신경망에 피드 하는 원시 데이터를 사용하는 것이 문제 일 수 있습니다 . 이 데이터는 고정 되어 있지 않으므로 모든 문제가 발생합니다.


8
예측에서이를 "순진한"예측이라고합니다. 즉, 마지막으로 관찰 한 예측을 사용합니다
Aksakal

감사합니다! @ Aksakal 당신은 얼마나 많은 이전 값을 예측에 사용 해야하는지 알고 있습니까?
Euler_Salter

문구성에 중점을 둡니다. 이 시계열에는 몇 개의 고정 지연이 상당히 좋습니다. 100 개 이상의 정지되지 않은 지연.
Alexey Burnakov

시계열에는 ACF와 PACF를 통해 지연 구조를 잘 추측 할 수있는 방법이 있습니다.이 포럼을 살펴보면 그 방법에 대한 많은 게시물이있었습니다
Aksakal

@AlexeyBurnakov 그래서 고정 된 상태로 변환해야한다는 것을 의미합니까?
Euler_Salter
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.