stl 또는 분해 중 어느 것이 더 낫습니까?


10

R을 사용하여 시계열 분석을 수행하고 있습니다. 데이터를 추세, 계절 및 랜덤 구성 요소로 분해해야합니다. 3 년 동안 매주 데이터가 있습니다. 나는 R의 두 가지 기능을 발견했다 - stl()decompose(). 나는 stl()곱셈 분해에 좋지 않다는 것을 읽었습니다 . 이 기능을 사용할 수있는 시나리오를 아는 사람이 있습니까?


1
당신은 그렇지 않으면 우리는 가까운 당신이 시도 권고 스택 교환 또는 마이그레이션해야합니다, 당신의 문제에 대한 일부 내용을 제공해야합니다 ?stl?decompose.
AdamO

답변:


4

나는 말할 것이다 STL. STL은 추세와 계절을 봅니다 : http://www.wessa.net/download/stl.pdf

분해 만 계절별 문서를 참조하십시오 : http://stat.ethz.ch/R-manual/R-devel/library/stats/html/decompose.html

그들과 함께 일할 때 트렌드 유형 (곱하기, 가산) 및 시즌 유형 (곱하기, 가산)을 반드시 포함하십시오. 트렌드는 때때로 감쇠 요소도 가질 수 있습니다.

곱셈 분해를 통해 추세의 경우를 의미한다고 가정합니다. 지수 성장 함수를 분해하지 않으면 곱셈 분해를 사용할 수 없습니다.


간단한 경우의 곱셈 분해는 기본 모델이 Y = 추세 * 계절 * 오류 인 경우입니다. 곱셈 모델은 비지 수적 상황에서 나타납니다. 예를 들어 판매의 경우 특정 수준의 트래픽과 특정 전환율이 있으므로 계절적 구성 요소는 추세에 비례하여 변합니다. 해결책은 Natalie가 설명하는 것입니다.

5

decomposeR 의 기능 단점 :

  1. 처음 몇 개와 마지막 몇 개 관측에서는 추세 추정을 사용할 수 없습니다.
  2. 계절 성분이 매년 반복된다고 가정합니다.

그래서 저는 STL을 선호합니다. 먼저 데이터의 로그를 취한 다음 구성 요소를 역변환하여 곱셈 분해를 얻을 수 있습니다.


1

STL은 계절성을 바꿀 수있는 고급 기술로, 계절성이 달라질 수 있다는 점에서 다릅니다 decompose.

STL 작동 방식에 대한 이해를 얻으려면 :

  • 알고리즘은 모든 계절 하위 세리를 추정합니다 (7 일 계절성에서는 7 개의 하위 시리즈 (월요일 시간 세리, 화요일 시간 세리 등)를 추정 함).
  • 그런 다음 모든 하위 시리즈에서 황토 회귀를 실행하여 지역 계절성을 추정합니다.

계절에 따라 다양한 효과를 얻을 수 있습니다. 계절성을 바꾸지 않으려면 (즉, 각 하위 세리의 예상 효과가 전체 시간에 걸쳐 일정하게 유지됨) 계절 창을 무한 또는 "정기"로 지정할 수 있습니다. 이것은 각 하위 세리의 평균과 같으며 모든 포인트에 동일한 가중치를 부여합니다 (더 이상 "로컬"효과가 없음). decompose계절 하위 구성 요소는 STL의 특수 구성 인 전체 시간 계열에서 일정하게 유지되므로 본질적으로 동일합니다.

이것은 https://www.otexts.org/fpp/6/1에 잘 설명되어 있습니다 .

STL은 계절성을 가산 적으로 추정합니다. 이전 소스에서 몇 페이지 뒤에 설명했듯이 로그 변환 (또는 Cox-Box 변환)을 사용하여 곱하기 방식으로 계절성을 추정 할 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.