시계열을 고정시키는 방법?


42

차이를 취하는 것 외에도 고정되지 않은 시계열을 고정시키는 다른 기술은 무엇입니까?

일반적 으로 지연 연산자 통해 고정식으로 만들 수있는 경우 계열을 " 순서 p의 통합 "이라고합니다 .(1L)PXt

답변:


18

디트 렌딩 은 기본입니다. 여기에는 시간 이외의 공변량에 대한 회귀 분석이 포함됩니다.

계절 조정 은 차이점을 반영한 버전이지만 별도의 기술로 해석 될 수 있습니다.

변환 데이터는 암시 적으로 다른 것을 차분 변환 연산자; 예를 들어, 로그의 차이는 실제로 비율입니다.

일부 EDA 스무딩 기술 (이동 중간 값 제거 등)은 비모수 적 비 추세 방식으로 해석 될 수 있습니다. 그들은 EDA에 관한 그의 책에서 Tukey에 의해 사용되었습니다. Tukey는 잔차를 비추고 필요한만큼 오랫동안이 과정을 반복하여 계속 진행했습니다 (잔여가 정지되고 대칭 적으로 0에 분포 된 잔차를 달성 할 때까지).


추세가 어떻게 수행되는지 더 설명 할 수 있습니까? 회귀에 의한 공변량의 영향을 제거하는 방법은 무엇입니까? 내가 맞으면 다변량 시계열에만 적용됩니다.
Arpit Sisodia

1
@Arpit 공변량에 대한 회귀 분석에서 잔차로 원래 데이터를 대체합니다. 다변량 시계열뿐만 아니라 일 변량 시계열에도 적용됩니다. 이에 대해서는 stats.stackexchange.com/a/113207/919stats.stackexchange.com/a/46508/919에 자세히 설명되어 있습니다.
whuber

@whuber 공변량에 대한 회귀 (정 지적이지 않을 수 있음)가 우리를 가짜 회귀 문제에 노출 시킨다고 생각하지 않습니까?
Vishaal Sudarsan

10

나는 여전히 한 기간에서 다음 기간으로 % 변화를 사용하는 것이 처음 제안 할 때 고정식이 아닌 변수를 고정시키는 가장 좋은 방법이라고 생각합니다. 로그와 같은 변환은 합리적으로 잘 작동합니다 (고정되지 않은 품질을 평탄화하지만 완전히 제거하지는 않습니다).

세 번째 방법은 하나의 단일 선형 회귀 분석에서 동시에 데이터의 계절을 제거하고 역 추세를 줄이는 것입니다. 하나의 독립 변수는 추세 (또는 시간)입니다. 1, 2, 3, ...의 기간 수. 그리고 다른 변수는 11 가지 범주 (12 개월 중 11 개월)의 범주 형 변수입니다. 그런 다음이 회귀 분석의 결과 계수를 사용하여 동시에 데이터의 추세를 추론하고 비계 절화 할 수 있습니다. 전체 데이터 세트가 기본적으로 평평한 것을 볼 수 있습니다. 기간 간의 나머지 차이는 성장 추세와 계절에 관계없이 변경 사항을 반영합니다.


초보자에게 계수를 좀 더 정교하게 설명 할 수 있습니까? 필자의 경우 (성장률) 로그를 다르게하면 추세가 평평하지만 계절성이 강해지기 때문에 귀하의 접근법이 시도해 볼 가치가 있다고 생각합니다. 따라서 모의 접근 방식은 시도해 볼 가치가 있습니다. 그러나 두 계수로 무엇을해야합니까? 특히 나는 인형을 의미합니다 ...
hans0l0

ran2, 나는 그것이 분명하지 않을 수도 있다는 것을 알고 있지만, 이미 가지고있는 것보다 훨씬 더 잘 설명 할 수는 없습니다. 그것은 무엇보다도 내 자신의 의사 소통 기술을 반영합니다. 대신, 자주 작동하지 않는 기본 수정을 제안합니다. 즉, 단순히 명목 시계열 변수를 한주기에서 다음 주기로의 % 변화로 변경하는 것입니다. 공칭 값 대신 % 변화에 초점을두면 고정 변수가 아닌 고정 변수로 즉시 변경되어 즉시 회귀 할 수 있습니다.
Sympa

7

로그와 역수 및 기타 전력 변환은 종종 예기치 않은 결과를 생성합니다.

잔여 추세 (예 : Tukey)의 추이는 일부 경우에 적용 할 수 있지만 위험 할 수 있습니다. 반면에, 탐지 수준 이동 및 추세 변화는 중재 탐지 방법을 사용하는 연구원들에게 체계적으로 이용 가능합니다. 펄스가 레벨 시프트의 차이 인 것처럼 레벨 시프트는 시간 추세의 차이이기 때문에 Ruey Tsay가 채택한 방법은이 문제에 쉽게 적용됩니다.

시리즈가 레벨 시프트 (즉, 인터셉트의 변화)를 나타내는 경우, 시리즈를 정지시키기위한 적절한 해결책은 시리즈를 "demean"시키는 것이다. Box-Jenkins는 비정규 성 치료제가 차별화 된 운영자라고 가정하여 비판적으로 오류를 범했습니다. 따라서 때때로 차이가 적절하고 다른 경우에는 평균 이동 "s"를 조정하는 것이 적절합니다. 어느 경우이든, 자기 상관 함수는 비정상 성을 나타낼 수있다. 이것은 시리즈의 상태 (정지 또는 비 정지)의 증상입니다. 비정규 성이 밝혀진 경우 원인이 다를 수 있습니다. 예를 들어 계열에 실제로 연속 평균이 변하거나 계열에 일시적인 평균 변동이 있습니다.

제안 된 접근 방식은 1982 년에 Tsay가 처음 제안되었으며 일부 소프트웨어에 추가되었습니다. 연구원들은 Tsay의 Journal of Forecasting 기사 "Outliers, Level Shifts and Variance Changes in Time Series", Journal of Forecasting, Vol. 7, I-20 (1988).

평소와 같이 교과서에는 최첨단 기술이 통합되어 있지 않지만이 자료는 Wei book (즉, 시계열 분석)에서 참조 할 수 있으며 Delurgio와 Makradakis는 통합 개입을 다루지 만 Wei의 텍스트가 감지하는 방식은 다루지 않습니다.


4

다른 시리즈와의 차이점. 즉, 브렌트 유가는 고정적이지 않지만, 브렌트 유가 가벼운 단 원유가 스프레드입니다. 예측에있어 더 위험한 제안은 다른 시계열과의 통합 관계가 존재하는 것에 내기하는 것입니다.


4

데이터를 통해 황토 / 스플라인을 피팅하고 잔차를 사용할 수 있습니까? 잔차가 고정되어 있습니까?

고려해야 할 문제로 어려움을 겪고있는 것 같습니다. 아마도 초과 차분에 대한 것보다 지나치게 유연한 곡선의 표시가 분명하지 않을 것입니다.


명확하지만 아직 과소 평가 된 솔루션을 언급 한 +1 모든 방법에는 문제가 있지만 비모수 적 평활화는 기본적이며 제안 된 다른 모든 추이 분석법이이 방법과 어떤 관련이 있는지에 대한 적절한 탐색이 필요합니다. 관련 소식을 듣고 기뻐할 것입니다 ...
zkurtz
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.