시계열 분석 포인트는 무엇입니까?


29

시계열 분석 포인트는 무엇입니까?

회귀 및 기계 학습과 같은 다른 유스 케이스가있는 다른 통계적 방법이 많이 있습니다. 회귀는 두 변수 간의 관계에 대한 정보를 제공 할 수 있지만 기계 학습은 예측에 유용합니다.

그러나 시계열 분석이 어떤 것인지 알 수 없습니다. 물론, ARIMA 모델을 적합하게하여 예측에 사용할 수 있지만 해당 예측의 신뢰 구간이 클 때의 이점은 무엇입니까? 세계 역사상 가장 데이터 중심의 산업 임에도 불구하고 아무도 주식 시장을 예측할 수없는 이유가 있습니다.

마찬가지로 프로세스를 더 이해하기 위해 어떻게 사용합니까? 물론, 나는 ACF를 구성하고 "aha! 약간의 의존성이 있습니다!" 점은 무엇인가? 물론 의존성이 있기 때문에 시계열 분석을 시작해야합니다. 당신은 이미 의존성이 있다는 것을 알고있었습니다 . 그러나 당신은 그것을 위해 무엇을 사용할 것입니까?


13
금융 및 경제와 별개로 잘 작동하는 다른 사용 사례가 있습니다.
user2974951

29
다른 통계 및 기계 학습 방법을 사용하여 주식 시장을 예측할 수 없습니다.

16
ARIMA가 회귀의 한 형태가 아님을 암시하는 것 같습니다. 그것은.
Firebug

10
전문가들에게는 답이 분명해 보이지만 이것이 좋은 질문이라고 생각합니다.
gung-복직 모니카

6
나는 최소한의 연구 노력으로 대답 할 것이기 때문에 @gung과 다른 사람들과달라고 간청합니다.
whuber

답변:


54

한 가지 주요 용도는 입니다. 나는 슈퍼마켓이 내일 판매 할 특정 제품의 몇 단위를 예측하여 10 년 이상 가족에게 먹이를 주었으므로 충분한 재고를 주문할 수는 있지만 너무 많지는 않습니다. 이것에 돈이 있습니다.

다른 예측 사용 사례는 International Journal of Forecasting 또는 Foresight 와 같은 출판물에 제공됩니다 . (전체 공개 : 저는 Foresight의 편집자입니다 .)

예, 때로는 이 큽니다. (귀하가 아니라 PI를 의미한다고 가정합니다 . 차이가 있습니다. ) 이것은 단순히 프로세스를 예측하기 어렵다는 것을 의미합니다. 그런 다음 완화해야합니다. 슈퍼마켓 판매를 예측할 때 많은 안전 재고가 필요합니다. 해수면 상승을 예측할 때 더 높은 제방을 지어야합니다. 큰 예측 간격이 유용한 정보를 제공한다고 말하고 싶습니다.

또한 모든 예측 사용 사례에서 예측은 더 큰 주제이지만 분석이 유용합니다. 당신이 할 필요가 있도록 자주 계정으로 시계열의 종속성을 고려하여 예측을 향상시킬 수 있습니다 이해 단지보다 더 구체적이다, 분석을 통해 그들을 알고 종속성이 있습니다.

또한 사람들은 예측하지 않아도 시계열에 관심이 있습니다. 계량 경제학자들은 거시 경제 시계열의 변화 점을 탐지하는 것을 좋아합니다. 또는 조세법 변경과 같은 개입이 GDP 또는 다른 것에 미치는 영향을 평가하십시오. 더 많은 영감을 얻기 위해 좋아하는 계량 경제학 저널을 훑어 볼 수 있습니다.


14
+1. 다른 곳에서도 유용합니다. 시계열 분석을 수행하면 관심있는 결과에 영향을 미치는 이벤트 (알지 못했음)를 확실히 알릴 수 있습니다. 저와 제 동료 모두 화요일 아침 오전에 제품 화학 분석에 대해 심각하게 악화되었다는 사실을 알게되어 기절했습니다. 우리는 그것을 약간의 약점을 가진 잘 계획된 청소 일정으로 다시 추적했습니다. 우리는 1 년 가까이 백만 달러를 절약하고 제품 ppk를 1.7에서 1.9로 개선했습니다. 교훈 : 항상 변형 프레임 문제에 대해 기본적인 시계열 분석을 수행합니다.
Stian Yttervik

+1. @Stephan Kolassa, 귀하의 답변은 실제 상황에서 예측이 사용되는 방식을 강조하며 이는 OP의 질문에 대한 나의 해석입니다. 예측 간격 지점 및 (반) 길이는 완화 전략을 계획하는 데 필요한 정보입니다. 맨해튼의 홍수를 막기 위해 제방을 건설하고 새로운 시계열 방법으로 예측 간격을 충분히 줄이면 필요한 자원 만 사용하여 제방 건설 비용을 줄일 수 있습니다. Mutatis mutandis 는 식료품 예에 적용됩니다.
Lucas Roberts

13

M. Dettling의 수업 슬라이드에서 TS 분석의 목표 :

1) 탐색 적 분석 : 시리즈의 속성 시각화

  • 시계열도
  • 추세 / 계절 패턴 / 임의의 오류로 분해
  • 의존성 구조를 이해하기위한 코렐로 그램

2) 모델링 : 확률 모델을 데이터의 시리즈에 가장 중요한 속성을 나타내는 데이터에 적합

  • 탐구 또는 사전 지식
  • 모델 선택 및 파라미터 추정이 중요합니다
  • 추론 : 모형이 데이터에 얼마나 적합합니까?

3) 예측 : 불확실성의 척도를 가진 미래 관측의 예측

  • 주로 모델 기반, 의존성 및 과거 데이터 사용
  • 외삽 법이므로 종종 소금 한 알갱이
  • 리어 윈도우 미러를보고 차를 운전하는 것과 유사

4) 프로세스 제어 : (물리적) 프로세스의 출력은 시계열을 정의합니다

  • 확률 모델은 관측 된 데이터에 적합
  • 이를 통해 신호와 노이즈를 모두 이해할 수 있습니다
  • 정상 / 비정상 변동을 모니터링하는 것이 가능합니다

5) 시계열 회귀 분석 : 하나 이상의 입력 시리즈를 사용하여 응답 시간 시리즈 모델링 iid 오류 가정 하에서이 모델 맞추기 :

  • 편견없는 추정으로 이어지지 만 ...
  • 종종 매우 잘못된 표준 오류
  • 따라서 신뢰 구간과 테스트는 오도의 소지가 있습니다

주식 표시 문제에 관하여 :

  • 이 TS는 매우 휘발성이어서 모델링하기가 어렵습니다.
  • 예를 들어, 회사와 관련된 법률의 변경으로 TS 프로세스가 변경 될 수 있습니다 ... 통계 도구는 어떻게이를 예측할 수 있습니까?

직렬 상관 관계 정보 :

  • 다변량 통계와 달리 시계열의 데이터는 일반적으로 iid가 아니지만 연속적으로 상관됩니다.
  • 이 정보는 또한 더러운 실험실 기기와 같이 iid가 아닌 것을 감지하는 데 유용 할 수 있습니다.

1
분류를 추가합니다. 예를 들어 휴대 전화의 가속도계 데이터를 분석하여 활동을 인식하는 수많은 앱이 있습니다.
SaiBot

그 흥미 롭군요! 어떻게합니까?
니콜 종이 접기 여우

1
여러 가지 방법이 있다고 생각합니다. 한 가지 방법은 사용자가 활동에 레이블을 지정하여 교육 데이터를 생성하도록하는 것입니다. 일단 당신이 (겹치는) 간격으로 (예를 들어, 3 초) 시계열을 삭감하고 기계 학습 모델을 훈련시킬 수 있습니다. 나중에 라벨이없는 활동을 분류 할 수 있습니다.
SaiBot

SaiBot 감사합니다. 나는 다른 도구들의 조합을 더 자주 고려해야한다 :)
Nicole Origami Fox

11

질문에 대답하는 가장 쉬운 방법은 대략 데이터 세트가 종종 단면 , 시계열패널 로 분류된다는 것을 이해하는 것입니다 . 횡단면 회귀 분석 은 횡단면 데이터 세트를위한 도구입니다. 이것은 대부분의 사람들이 회귀 라는 용어를 알고 참조하는 것입니다 . 시계열 회귀는 때때로 시계열에 적용되지만 시계열 분석에는 회귀를 넘어서는 광범위한 도구가 있습니다.

(x1,y1),(x2,y3),,(xn,yn)xi,yiyxy^x

여기에 이미지 설명을 입력하십시오

표본이 무작위가 아닌 경우 회귀가 전혀 작동하지 않을 수 있습니다. 예를 들어, 모델을 추정하기 위해 1 학년에서 소녀 만 선택했지만 12 학년 남성의 키를 예측해야합니다. 따라서 회귀는 횡단면 설정에서도 고유 한 문제가 있습니다.

xt,yt(x1,y1),(x2,y3),,(xn,yn)tx,y

여기에 이미지 설명을 입력하십시오

t

제 3 공통 데이터 세트 유형은 패널, 특히 제 1 길이 방향 데이터이다. 여기에서, 많은 학생들을 위해 체중과 신장 변수에 대한 몇 가지 스냅 샷을 얻을 수 있습니다. 이 데이터 세트는 횡단 또는 시계열 세트 처럼 보일 수 있습니다 .

여기에 이미지 설명을 입력하십시오

당연히 이것은 이전 두 유형보다 더 복잡 할 수 있습니다. 여기서는 패널 회귀 및 패널을 위해 개발 된 기타 특수 기술을 사용합니다.

요약하면, 시계열 회귀가 단면 회귀와 비교하여 별개의 도구로 간주되는 이유는 회귀 기술의 독립성 가정과 관련하여 시계열이 고유 한 문제를 제시하기 때문입니다. 특히, 단면 분석에서와 달리 관측 순서가 중요하다는 사실 때문에 일반적으로 모든 종류의 상관 관계 및 의존성 구조로 이어지며 때로는 회귀 기술의 적용을 무효화 할 수 있습니다. 의존성을 다루어야하며, 이것이 바로 시계열 분석이 잘하는 것입니다.

자산 가격의 예측 가능성

또한 주식 시장과 자산 가격에 대한 일반적인 오해를 반복해서 예측할 수 없습니다. 이 진술은 사실 이기에는 너무 일반적입니다. AAPL의 다음 진드기를 확실하게 예측할 수는 없습니다. 그러나 매우 좁은 문제입니다. 당신이 당신의 그물을 더 넓게 주조하면 모든 종류의 예측 (특히 시계열 분석)을 사용하여 돈을 벌 수있는 많은 기회를 발견하게 될 것입니다. 통계 차익 거래 는 그러한 분야 중 하나입니다.

이제 자산 가격이 단기적으로 예측하기 어려운 이유 는 가격 변동의 큰 구성 요소가 새로운 정보이기 때문입니다. 과거로부터 현실적으로 고안 될 수 없었던 진정한 새로운 정보는 정의 상으로는 불가능합니다. 그러나 이것은 이상적인 모델이며 많은 사람들이 국가의 지속성을 허용 하는 이상 이 존재 한다고 주장합니다 . 이는 가격 변동의 일부가 과거에 설명 될 수 있음을 의미합니다. 이러한 경우 시계열 분석은 지속성을 정확하게 처리하므로 매우 적합합니다. 새로운 것을 오래된 것과 분리하고 새로운 것을 예측하는 것은 불가능하지만 오래된 것은 과거에서 미래로 끌려갑니다. 조금이라도 설명 할 수 있다면 재정적으로 돈을 벌 수 있습니다. 그러한 예측에 기초한 전략의 가격이 그에 의해 생성 된 수입을 포괄하는 한.

마지막으로, 2013 년 경제학 노벨상을 살펴보십시오 . "다음 3 년에서 5 년과 같은 장기적으로 이러한 가격의 광범위한 과정을 예측할 수 있습니다." Shiller의 노벨 강의를 살펴보고 자산 가격의 예측 가능성에 대해 논의합니다.


6

시계열 분석은 또한 시간 데이터에서 효과적인 이상 또는 이상치 탐지에 기여할 수 있습니다.

예를 들어, ARIMA 모델을 맞추고 예측 간격을 계산할 수 있습니다. 유스 케이스에 따라 간격을 사용하여 프로세스를 제어 할 수있는 임계 값을 설정할 수 있습니다. 새 데이터가 임계 값을 벗어나면 추가주의를 위해 플래그가 지정됩니다.

이 블로그 게시물 에는 이상치 탐지에 대한 시계열 분석에 대한 간단하고 광범위한 개요가 있습니다. 보다 심층적 인 치료를 위해 ebay의 연구원들은 시계열 데이터의 통계 분석을 기반으로 규모에 따른 이상 탐지를 수행 한 방법을 설명합니다.


6

회귀 및 기계 학습과 같은 다른 유스 케이스가있는 다른 통계적 방법이 많이 있습니다. 회귀는 두 변수 간의 관계에 대한 정보를 제공 할 수 있지만 기계 학습은 예측에 유용합니다.

당신은 아래의 자신의 질문에 대답합니다 : 자기 상관. 시계열은 일반적으로 기본 OLS 회귀에 대한 가정을 위반하여이를 가지고 있습니다. 시계열 기술에는 시계열에 대한 적절한 가정이 있습니다.

순차 데이터를 처리하는 기계 학습 방법은 재귀 신경망 (RNN) 또는 1 차원 컨볼 루션 신경망 (CNN)과 같이 전문화되어 있으므로 시계열에 대한 특수 기술이 여전히 있습니다.

그러나 시계열 분석이 어떤 것인지 알 수 없습니다. 물론, ARIMA 모델을 적합하게하여 예측에 사용할 수 있지만 해당 예측의 신뢰 구간이 클 때의 이점은 무엇입니까? 세계 역사상 가장 데이터 중심의 산업 임에도 불구하고 아무도 주식 시장을 예측할 수없는 이유가 있습니다.

시계열 기술로 인한 신뢰 구간 (CI)은 시계열이 아닌 회귀 분석의 신뢰 구간보다 클 수 있습니다. 이 기능은 정확한 것으로 알려져 있습니다. 일반적으로 시계열이 아닌 회귀를 사용하면 CI가 작아 지지만 해당 가정을 위반했기 때문에 CI가 올바르지 않습니다. 작은 CI가있는 그래프 만 표시하면 CI를 구성하거나 완전히 건너 뛰지 만 적절한 CI를 원할 경우 적절한 기술을 사용하십시오.

주식 시장은 본성 때문에 예측하기가 어렵습니다. 다른 시계열은 훨씬 더 예측 가능합니다. 주식 시장에서 선택한 머신 러닝 기법을 사용해보십시오. 더 많은 성공을 거두지 못할 것입니다.

마찬가지로 프로세스를 더 이해하기 위해 어떻게 사용합니까? 물론, 나는 ACF를 계획하고 "aha! 약간의 의존성이 있습니다!" 점은 무엇인가? 물론 의존성이 있기 때문에 시계열 분석을 시작해야합니다. 당신은 이미 의존성이 있다는 것을 알고있었습니다. 그러나 당신은 그것을 위해 무엇을 사용할 것입니까?

예측하기. 계절성을 볼 수 있습니다. 계절에 따른 데이터의 변동성에 대한 아이디어 State Space 방법과 같이 구식 ARIMA보다 더 강력한 시계열 기술이 있다는 것은 말할 것도 없습니다. ARIMA는 시계열 모델링에 가장 적합한 기술이 아닙니다. (실제로, 선택한 통계 소프트웨어의 ARIMA 절차는 아마도 후드 아래의 상태 공간 표현을 사용하고있을 것입니다.)


5

redhqs의 이상 탐지에 대한 색상을 추가하기 위해 직장에서 영업 및 트래픽 흐름과 같은 운영 메트릭에 대한 이상 탐지 모델을 작성합니다. 우리는 시계열 분석을 통해 모든 것이 예상대로 작동하는 경우 매출이 무엇인지 이해 한 다음 관찰 된 값과 비교하여 웹 사이트가 손상되었는지 확인합니다. 매분 사이트가 다운되기 때문에 많은 돈을 잃고 있기 때문에 중요합니다.

사용할 수있는 방법은 여러 가지가 있으며 많은 경우 다른 방법으로 다른 일을 시도합니다. 예를 들어, 판매 이상 탐지에 사용한 주요 통계 방법을 "STL"(loess를 사용한 계절별 추세 분해)이라고합니다. 이는 정기적 인 계절성, 추세 및 랜덤 노이즈를 분리합니다. 우리는 실제로 매일 및 매주 계절성을 식별하기 위해 이것을 사용합니다. 그런 다음 소음을 제거하고 추세 / 계절을 결합하여 예상 판매량을 추정합니다. 따라서 우리는 시간과 요일에 따라 판매가 어떻게 달라지는 지 이해하고 추정치에서 임의 노이즈를 제외하기 위해이 접근 방식을 사용합니다.


SARIMA prtion과 발견 대기 중을 동시에 동시에 식별 할 수있는 모델 식별 전략과 달리 이상 징후가없는 것으로 추정되는 시계열 모델을 작성하는 경우 중재 구조 (펄스, 레벨 / 단계 이동) , 계절별 펄스, 현지 시간 추세)
IrishStat

STL 알고리즘에는 견고성 플래그 (스무딩 루프의 반복 횟수를 제어)가 있습니다. 그것은 어쨌든 우리 시계 시리즈에 아주 잘 작동합니다.
Willie Wheeler

결정적 구조가 발견되기를 기다리는 경우 반복 횟수는 모델 형식의 바이어스를 처리하지 않습니다.
IrishStat

3

다른 사람들이 제공 한 훌륭한 답변 외에도 시계열 분석이 전기 공학에서 어떻게 사용되는지에 대해 언급하고 싶습니다.

전기 공학의 대부분은 정보를 전송하기 위해 전압과 전류를 변조하거나 센서를 사용하여 물리적 신호 (예 : 음파)를 전기 형태로 변환하여 컴퓨터에서 결정을 내립니다. 아날로그-디지털 (A / D) 변환기는 이러한 신호를 일정한 간격으로 이산 된 샘플 세트 또는 시계열로 변환합니다! 시계열 분석 방법은 거의 모든 최신 신호 처리 알고리즘의 기초입니다.

예를 들어, 음성 처리는 마이크를 사용하여 음파를 전기 전압으로 변환하고,이 전압을 A / D로 샘플링 한 후 신호의 시계열 모델이 생성됩니다. 예를 들어, 휴대폰의 선형 예측 코더 (LPC) 는 말하고있는 단어의 ARMA 모델을 생성하고 데이터 샘플 자체 대신 (사전 정의 된 사전의 여기 신호를 나타내는 인덱스와 함께) 모델 계수를 전송합니다. 데이터 압축.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.