타임 시리즈 분석과 머신 러닝?


10

일반적인 질문입니다. 시계열 데이터가있는 경우 기계 / 통계 학습 기법 (KNN, 회귀)보다 시계열 기법 (일명 ARCH, GARCH 등)을 사용하는 것이 더 좋은 방법은 무엇입니까? 교차 검증 된 유사한 질문이있는 경우, 저를 찾아서 찾을 수없는 문제에 대해 알려주십시오.


답변:


9

일반적인 머신 러닝 방법은 데이터가 독립적이고 동일하게 분산되어 있다고 가정하지만 이는 시계열 데이터에는 해당되지 않습니다. 따라서 정확성 측면에서 시계열 기술에 비해 단점이 있습니다. 이에 대한 예는 이전 질문 기계 학습임의 포리스트에 대한 시계열 순서 초과를 참조하십시오 .


답변 주셔서 감사합니다. 요컨대, 머신 러닝은 데이터에서 관계를 찾는 데 더 관심이있는 반면 시계열 분석은 데이터의 원인을 정확하게 식별하는 데 더 관심이있는 것 같습니다. 즉 확률 적 요인이 데이터에 미치는 영향. 이것에 동의하십니까?
Nagy

4
아니요, 그 요약에 동의하지 않습니다.
Tom Minka

4

Francis Diebold는 최근 자신의 블로그 에 "ML과 메트릭스 VI : ML과 TS 에코 노 메트릭스의 주요 차이점" 을 게시했습니다. 나는 그것의 단축 버전을 제공하고 있으므로 모든 크레딧이 그에게 전달됩니다. (굵은 글씨가 내 것입니다.)

[S] Tatistical Machine Learning (ML)과 시계열 계량 경제학 (TS)은 공통점이 많습니다. 그러나 흥미로운 차이점도 있습니다. 조건부 평균 비선형 성의 유연한 비모수 적 모델링에 대한 ML의 강조는 TS에서 큰 역할을하지 않습니다. <...>

[T] 여기 가장 경제적 인 시계열의 공분산-정지 (비 추세, 비계 절화) 역학에서 중요한 조건-평균 비선형성에 대한 증거는 거의 없다. <...> 실제로 나는 (적어도 일부) 경제 시계열에서 반복적으로 중요한 것으로 나타난 조건부 평균 비선형 성의 한 가지 유형, 즉 해밀턴 스타일 마르코프 전환 역학만을 생각할 수있다.

[물론 방에는 비선형 코끼리가 있습니다 : 엥글 스타일의 가르치 식 역학. 금융 계량 경제학, 때로는 거시 경제학에서도 엄청나게 중요하지만 조건부 수단이 아니라 조건부 분산에 관한 것입니다.]

따라서 TS에는 기본적으로 두 가지 중요한 비선형 모델 만 있으며 그 중 하나만 조건부 평균 역학을 말합니다. 그리고 결정적으로, 이들은 매우 엄격하게 파라 메트릭이며 경제 및 재무 데이터의 특수한 기능에 밀접하게 맞춰져 있습니다.

결론은 다음과 같습니다.

ML은 유연성이 높은 비모수 적 방식으로 비선형 조건부 평균 함수를 근사화합니다. 그것은 TS에서 이중으로 불필요하다는 것이 밝혀졌습니다. 걱정할 조건부 평균 비선형 성은 그리 많지 않으며, 종종 존재하는 경우, 고도로 전문화 된 (단단한 매개 변수) 방식으로 가장 잘 설명 된 고도로 전문화 된 특성입니다. .

나는 여기 에서 전체 원본 게시물을 읽는 것이 좋습니다 .


+1. 이 답변에 동의합니다. 일반적인 ML 방법은 비모수 적 모델링을 특징으로하며 ARMA 모델은 "긴밀한 매개 변수"인 반면 매우 완화 된 가정을합니다.
Digio

2

@Tom Minka가 지적한 것처럼 대부분의 ML 기술은 iid 입력을 가정합니다. 그래도 몇 가지 해결책이 있습니다.

  1. 시스템 '메모리'내의 모든 과거 시계열 샘플을 하나의 특징 벡터, 즉 x = [x (t-1), x (t-2), ... x (tM)]로 사용할 수 있습니다. 그러나 여기에는 두 가지 문제가 있습니다. 1) 비닝에 따라 거대한 피처 벡터 2가있을 수 있습니다. 일부 방법은 피처 벡터 내의 피처가 독립적이어야하는데 여기에는 해당되지 않습니다.

  2. 발작 탐지, 음성 처리 등에 매우 성공적으로 사용 된 히든 마르코프 모델과 같은 시계열 데이터를 위해 특별히 설계된 많은 ML 기술이 있습니다.

  3. 마지막으로, 내가 취한 접근법은 '기능 추출'기술을 사용하여 동적 회귀 문제 (시간 요소가 있음)를 정적 문제로 변환하는 것입니다. 예를 들어, PDM (Principal Dynamics Mode) 방식은 입력 과거 특징 벡터 ([x (t-1), x (t-2), ... x (tM)])를 정적 벡터 ([v ( 1), v (2), .. v (L)])는 시스템 별 선형 필터 뱅크 (PDM)와 과거를 통합함으로써 Marmarelis, 2004 book 또는 Marmarelis, Vasilis Z를 참조하십시오. "비선형 생리 학적 시스템의 모델링 방법 " 의 생명 공학 25.2 (1997)의 연대기 : 239-251 ...

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.