시계열의 통계적 유사성


15

주기, 최대, 최소, 평균 등과 같은 다양한 측정을 수행 할 수있는 시계열이 있다고 가정하고이를 사용하여 동일한 속성을 가진 모델 사인파를 생성한다고 가정 할 수 있습니다. 실제 데이터가 가정 된 모델과 얼마나 밀접하게 일치합니까? 시리즈의 데이터 포인트 수는 10 ~ 50 포인트입니다.

매우 간단한 첫 번째 생각은 사인파의 방향성 움직임에 값을 부여하는 것입니다. +1 +1, 실제 데이터와 동일하게 수행 한 다음 방향 이동의 유사성을 정량화합니다.

편집 : 내 데이터로 실제로하고 싶은 일에 대해 더 많이 생각하고 원래의 질문에 대한 응답을 고려할 때 경쟁 가정 사이에서 선택할 수있는 의사 결정 알고리즘이 필요합니다. 즉, 내 데이터가 기본적으로 선형 적입니다 (또는 주기적 요소를 가질 수있는 노이즈가있는 추세) 내 데이터는 기본적으로 순환 경향이 없으며 주기적입니다. 데이터는 본질적으로 단지 노이즈입니다. 또는 이러한 상태 사이에서 전환 중입니다.

내 생각은 이제 어떤 형태의 베이지안 분석과 유클리드 / LMS 측정법을 결합하는 것입니다. 이 접근법의 단계는

데이터 측정에서 추정 사인파 생성

LMS 직선을 데이터에 적합

위의 각각에 대한 원래 데이터에서 출발하기 위해 유클리드 또는 LMS 메트릭을 파생합니다.

이 측정 항목을 기준으로 각각에 대해 베이지안을 작성하십시오. 즉, 결합 된 출발의 60 %가 하나에, 40 %가 다른 하나에 부착되므로 40 %를 선호합니다.

데이터를 따라 창 하나의 데이터 포인트를 슬라이드하고 위의 내용을 반복하여 약간 변경된이 데이터 세트에 대한 새로운 % 메트릭을 얻습니다. 이것은 새로운 증거입니다.

이 슬라이딩 윈도우 (창 길이 10-50 데이터 포인트)로 전체 데이터 세트 (3000+ 데이터 포인트)를 따라 반복하십시오. 희망 / 의도는 데이터 세트의 어느 시점에서나 우세한 / 우호적 인 가정을 식별하고 시간에 따라 어떻게 변하는 지

이 잠재적 인 방법론에 대한 의견, 특히 베이지안 분석 부분을 실제로 구현할 수있는 방법에 대한 의견을 환영합니다.

답변:



5

비교하려는 특정 모델이있는 경우 : 특정 데이터 집합에 대해 가능한 매개 변수 값을 최소화하고 점수를 매기기 위해 최소 제곱을 메트릭으로 사용하는 것이 좋습니다. 기본적으로 모수 추정값을 연결하고 예측값을 생성하고 실제 값과의 평균 제곱 편차를 계산하기 만하면됩니다.

그러나 "어떤 모델이 내 데이터에 가장 적합합니까?" 어떤 경우에는 정규 분포 오차 조건을 가정하는 것이 좋습니다. 논쟁 할 수있는 것은 최소 제곱 가정과 비슷합니다. 그런 다음 선택한 모델에 따라 다른 모델 매개 변수가 (베이지 언 할당) 분배되는 방법에 대해 가정하고 R의 MCMC 패키지와 같은 것을 매개 변수의 분포에서 샘플링하는 데 사용할 수 있습니다. 그런 다음 사후 평균 및 분산을보고 어떤 모델이 가장 적합한 지 알 수 있습니다.


내 데이터에 맞는 두 가지 가능한 모델, 원래 질문에 설명 된 사인파와 LMS 직선 맞춤을 사용하면 사인파의 실제 데이터 값과 평균 제곱 편차를 잔차의 잔차와 간단히 비교할 수 있습니까? LMS 피팅 라인을 선택한 다음이 모델이 데이터에보다 정확하게 맞는다는 이유로 전체 값이 더 낮은 모델을 선택 하시겠습니까? 그렇다면 데이터를 반으로 나누고 반씩 똑같이 수행하는 것이 유효할까요? 동일한 사인파 / LMS를 사용하면 각 모델이 시간이 지남에 따라 어떻게 개선 / 나빠질 수 있는지 알 수 있습니다.
babelproofreader

잘 모르겠습니다. 내 제안은 최소 제곱 법을 사용하는 것이었지만 선형 회귀를 실행하는 것은 아닙니다. 주기적 회귀 분석을 확인할 수 있습니다 .
M. Tibbits

다른 질문에 관해서는, 데이터를 반으로자를 수 있습니까? 나는 그렇게 할 때 매우 신중할 것입니다. 왜냐하면 그것이 생각할 수있는 최소 주파수의 두 배이기 때문입니다. 푸리에 계수 ( FFT 또는 DCT를 취하고 그것들을 회귀합니까?!?- 확실하지 않음 ) 가 필요할 수도 있다고 생각합니다 . 또는 위에서 언급 한 것처럼 주기적 회귀.
M. Tibbits

3

방향성 움직임만을 정 성적으로 표현하는 "단순한 첫 생각"은 시계열 비교를위한 Keogh의 SAX 알고리즘과 유사합니다. 당신이 그것을 살펴 권하고 싶습니다 : Eamonn 키오 & 제시카 린 : SAX를 .

편집 결과, 문제를 다르게 다루는 것에 대해 생각하고있는 것처럼 들리지만 SAX는 퍼즐 조각을 제공한다는 것을 알 수 있습니다.


0

파티에 조금 늦었지만 사인파에 대해 생각하고 있다면 웨이블릿 변환은 주머니에 좋은 도구입니다. 이론적으로 웨이블릿 변환을 사용하여 시퀀스를 다양한 "파트"(예 : 다양한 모양 / 주파수의 웨이브, 트렌드와 같은 비파동 컴포넌트 등)로 분해 할 수 있습니다. 톤으로 사용되는 특정 형태의 파형 변환은 푸리에 변환이지만이 영역에는 많은 작업이 있습니다. 현재 패키지를 추천하고 싶지만 신호 분석 작업을 한동안 수행하지 않았습니다. 그러나 나는이 정맥에서 기능을 지원하는 일부 Matlab 패키지를 회상합니다.

주기적 데이터에서만 추세를 찾으려고하는 경우 다른 방향은 Mann-Kendall Trend 테스트와 같습니다. 계절적 영향이 큰 날씨 나 수질의 변화를 감지하는 등 많은 용도로 사용됩니다. 고급 접근 방식의 종소리와 호루라기가 없지만 베테랑 통계 테스트이기 때문에 해석하고보고하기가 매우 쉽습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.