답변:
일반적인 머신 러닝 방법은 데이터가 독립적이고 동일하게 분산되어 있다고 가정하지만 이는 시계열 데이터에는 해당되지 않습니다. 따라서 정확성 측면에서 시계열 기술에 비해 단점이 있습니다. 이에 대한 예는 이전 질문 기계 학습 및 임의 포리스트에 대한 시계열 순서 초과를 참조하십시오 .
Francis Diebold는 최근 자신의 블로그 에 "ML과 메트릭스 VI : ML과 TS 에코 노 메트릭스의 주요 차이점" 을 게시했습니다. 나는 그것의 단축 버전을 제공하고 있으므로 모든 크레딧이 그에게 전달됩니다. (굵은 글씨가 내 것입니다.)
[S] Tatistical Machine Learning (ML)과 시계열 계량 경제학 (TS)은 공통점이 많습니다. 그러나 흥미로운 차이점도 있습니다. 조건부 평균 비선형 성의 유연한 비모수 적 모델링에 대한 ML의 강조는 TS에서 큰 역할을하지 않습니다. <...>
[T] 여기 가장 경제적 인 시계열의 공분산-정지 (비 추세, 비계 절화) 역학에서 중요한 조건-평균 비선형성에 대한 증거는 거의 없다. <...> 실제로 나는 (적어도 일부) 경제 시계열에서 반복적으로 중요한 것으로 나타난 조건부 평균 비선형 성의 한 가지 유형, 즉 해밀턴 스타일 마르코프 전환 역학만을 생각할 수있다.
[물론 방에는 비선형 코끼리가 있습니다 : 엥글 스타일의 가르치 식 역학. 금융 계량 경제학, 때로는 거시 경제학에서도 엄청나게 중요하지만 조건부 수단이 아니라 조건부 분산에 관한 것입니다.]
따라서 TS에는 기본적으로 두 가지 중요한 비선형 모델 만 있으며 그 중 하나만 조건부 평균 역학을 말합니다. 그리고 결정적으로, 이들은 매우 엄격하게 파라 메트릭이며 경제 및 재무 데이터의 특수한 기능에 밀접하게 맞춰져 있습니다.
결론은 다음과 같습니다.
ML은 유연성이 높은 비모수 적 방식으로 비선형 조건부 평균 함수를 근사화합니다. 그것은 TS에서 이중으로 불필요하다는 것이 밝혀졌습니다. 걱정할 조건부 평균 비선형 성은 그리 많지 않으며, 종종 존재하는 경우, 고도로 전문화 된 (단단한 매개 변수) 방식으로 가장 잘 설명 된 고도로 전문화 된 특성입니다. .
나는 여기 에서 전체 원본 게시물을 읽는 것이 좋습니다 .
@Tom Minka가 지적한 것처럼 대부분의 ML 기술은 iid 입력을 가정합니다. 그래도 몇 가지 해결책이 있습니다.
시스템 '메모리'내의 모든 과거 시계열 샘플을 하나의 특징 벡터, 즉 x = [x (t-1), x (t-2), ... x (tM)]로 사용할 수 있습니다. 그러나 여기에는 두 가지 문제가 있습니다. 1) 비닝에 따라 거대한 피처 벡터 2가있을 수 있습니다. 일부 방법은 피처 벡터 내의 피처가 독립적이어야하는데 여기에는 해당되지 않습니다.
발작 탐지, 음성 처리 등에 매우 성공적으로 사용 된 히든 마르코프 모델과 같은 시계열 데이터를 위해 특별히 설계된 많은 ML 기술이 있습니다.
마지막으로, 내가 취한 접근법은 '기능 추출'기술을 사용하여 동적 회귀 문제 (시간 요소가 있음)를 정적 문제로 변환하는 것입니다. 예를 들어, PDM (Principal Dynamics Mode) 방식은 입력 과거 특징 벡터 ([x (t-1), x (t-2), ... x (tM)])를 정적 벡터 ([v ( 1), v (2), .. v (L)])는 시스템 별 선형 필터 뱅크 (PDM)와 과거를 통합함으로써 Marmarelis, 2004 book 또는 Marmarelis, Vasilis Z를 참조하십시오. "비선형 생리 학적 시스템의 모델링 방법 " 의 생명 공학 25.2 (1997)의 연대기 : 239-251 ...