시계열이 정지해야하는 이유는 무엇입니까?


92

나는 고정 시계열이 시간이 지남에 따라 평균과 분산이 일정하다는 것을 이해합니다. 다른 ARIMA 또는 ARM 모델을 실행하기 전에 데이터 세트가 고정되어 있는지 확인해야하는 이유를 누군가에게 설명해 주시겠습니까? 자기 상관 및 / 또는 시간이 중요하지 않은 일반 회귀 모형에도 적용됩니까?


2
ARM 모델이란 무엇입니까? ARMA을 의미 했습니까?
mpiktas

9
정상 성은 일정한 평균과 분산 이상의 것을 요구합니다. 약한 정상 공분산 함수 가 의존하지 않아야 합니다. tcov(Xt,Xt+h)t
mpiktas

11
순서가 인 경우 명시 적으로 정 지적 이지 않으므로 AR MA 모델 을 실행하기 위해 정상 성이 필요하지 않습니다 . 그러나 정상 성은 ARMA의 가정입니다. I ( ) > 0II()>0
Glen_b

1
경우 엄격하게, 그는 비록 주문 코멘트 +1, 의 순서에 . 임의의 주문의 경우, 거기에 ARFIMA{ 0 , 1 , 2 , . . . }I{0,1,2,...}
conjugateprior

@Glen_b ARIMA 모델을 고정식 시리즈에 적용 할 수 있습니까? 또는 ARIMA cana가 적용되는 특수한 nonairairty 경우가 있습니까?
Nizar

답변:


75

문구 성은 의존성 구조의 한 유형입니다.

데이터가 있다고 가정하십시오 . 가장 기본적인 가정은 가 독립적이라는 것입니다. 즉 샘플이 있습니다. 독립성을 사용하면 유용한 결과를 얻을 수 있기 때문에 좋은 속성입니다. 문제는 때때로 (또는보기에 따라 자주)이 속성이 유지되지 않는다는 것입니다.X iX1,...,XnXi

이제 독립성은 고유 한 속성이며 두 개의 임의 변수는 한 가지 방식으로 만 독립적 일 수 있지만 다양한 방식으로 종속 될 수 있습니다. 따라서 정상 성은 의존 구조를 모델링하는 한 가지 방법입니다. 독립적 인 랜덤 변수 (많은 수의 법칙, 소수의 중심 제한 정리)에 대한 많은 좋은 결과가 고정 랜덤 변수 (우리는 엄격하게 순서를 말해야 함)를 유지합니다. 물론 많은 양의 데이터가 정지 된 것으로 간주 될 수 있으므로, 비 지속성 데이터를 모델링 할 때 정상 성의 개념이 매우 중요합니다.

우리가 정상 성을 가지고 있다고 판단했을 때, 우리는 자연스럽게 그것을 모델링하고 싶습니다. 이것은 ARMA 모델이 들어오는 곳입니다. Wold 분해 정리 덕분에 모든 고정 데이터가 고정 ARMA 모델로 근사화 될 수 있습니다 . 그렇기 때문에 ARMA 모델이 널리 사용되는 이유는이 모델을 사용하기 위해 시리즈가 고정되어 있는지 확인해야하는 이유입니다.

이제 다시 한 번 같은 이야기가 독립성과 의존성과 관련이 있습니다. 고정 성은 고유하게 정의됩니다. 즉, 데이터는 고정되어 있거나 그렇지 않기 때문에 데이터가 고정 될 수있는 방법은 있지만 고정되지 않는 방법은 많습니다. 다시 말하지만 특정 변환 후 많은 데이터가 정지 상태가됩니다. ARIMA 모델은 정상이 아닌 모델입니다. 차분 후에 데이터가 정지되는 것으로 가정합니다.

회귀 상황에서 데이터가 정지 된 경우 독립 데이터 보유에 적용되는 동일한 결과가 있기 때문에 정상 성이 중요합니다.


4
이 부분을 응답의 일부로 두는 것이 좋습니다 ( "이 부분은 ARMA 모델이 들어온 곳입니다. Wold 분해 이론 덕분에 모든 고정 데이터가 고정 ARMA 모델로 근사화 될 수 있습니다. 따라서 ARMA 모델은 인기가 많기 때문에 이러한 모델을 사용하기 위해 시리즈가 고정되어 있는지 확인해야합니다. ") 굵게 표시되어 있습니다.
Poete Maudit

34

시계열에 대한 통계 분석을 수행 할 때 일반적으로 어떤 수량에 관심이 있습니까? 알고 싶다

  • 기대 값
  • 분산과
  • 값들 사이의 상관 관계 간격 세트에 대한 기간 값.ss

우리는 이런 것들을 어떻게 계산합니까? 여러 기간에 걸쳐 평균을 사용합니다.

여러 기간에 걸친 평균은 예상 값이 해당 기간에 걸쳐 동일한 경우에만 유익합니다. 이러한 모집단 변수가 다를 수있는 경우 시간에 따른 평균을 계산하여 실제로 추정하는 것은 무엇입니까?

(약한) 정상 성은 이러한 모집단 수량이 시간이 지남에 따라 같아야하므로 표본 평균을 추정하기위한 합리적인 방법으로 만듭니다.

이 외에도 고정 프로세스는 가짜 회귀 문제를 피합니다 .


12

통계 학습의 기본 아이디어는 실험을 반복하여 학습 할 수 있다는 것입니다. 예를 들어, 압정이 머리에 닿을 확률을 알기 위해 압정을 계속 뒤집을 수 있습니다.

시계 열적 맥락에서, 우리는 확률 적 프로세스의 반복 된 실행보다는 확률 적 프로세스의 단일 실행을 관찰한다. 여러 개의 독립적 인 실험보다는 하나의 긴 실험을 관찰합니다.

확률 론적 프로세스의 장기 실행을 관찰하는 것이 확률 론적 프로세스의 많은 독립적 인 실행을 관찰하는 것과 유사 해지려면 정상 성과 ergodicity가 필요합니다.

일부 (부정확 한) 정의

Ω{Yt}t{1,2,3,}ωΩ

  • tYtΩ
  • ωX(ω){Y1(ω),Y2(ω),Y3(ω),}

시계열의 근본적인 문제

X1X2X3i=1,,nωiΩX1ni=1nXiE[X]

tΩ

1Tt=1TYt

표본 공간 에서 여러 번 끌어 오는 것과 비슷한 작업을 수행하기 위해 시간 이 지남에 따라 여러 번 관찰 하려면 정상 성과 력이 필요합니다 .

E[Y]1Tt=1TYtE[Y]

예 1 : 정상 성의 실패

{Yt}Yt=t{Yt}

이라고하자St=1ti=1tYiSttS1=1,S2=32,S3=2,,St=t+12YtStt

예 : 에르고 디의 실패

XYt=Xt{Yt}=(0,0,0,0,0,0,0,){Yt}=(1,1,1,1,1,1,1,

비록 이지만E[Yt]=12St=1ti=1tYiYt


10

우수하지만 더 자세한 다른 답변에 대해 높은 수준의 답변을 추가하려면 데이터를 설명하는 모델이 각기 다른 시점에서 정확도가 달라질 수 있기 때문에 정상 성이 중요합니다. 따라서 모든 관심 지점에서 데이터를 정확하게 설명하기 위해 평균, 분산 및 상관 관계와 같은 샘플 통계에는 정상 성이 필요합니다.

600<t<800200<t<400

여기에 이미지 설명을 입력하십시오


8

xt=xt1+et

그러나 우리는 종종 문 구성을 찾습니다. 왜?

예측 문제를 고려하십시오. 당신은 어떻게 예측합니까? 모든 것이 내일 다르다 면 모든 것이 달라지기 때문에 예측이 불가능합니다. 따라서 예측의 핵심은 내일과 같은 것을 찾아 내일로 확장 하는 것입니다. 그 일이 무엇이든 될 수 있습니다. 몇 가지 예를 들어 보겠습니다.

etN(0,σ2)σ2Δxtxtxt1=etΔxt

xt=αt+etE[et]=0α

예측을 위해서는 시리즈에서 상수 (시간 불변) 구성 요소를 찾아야합니다. 그렇지 않으면 정의로 예측할 수 없습니다. 고정 성은 불변의 특별한 경우입니다.


5

ARIMA는 대부분 자체적으로 회귀하기 때문에 강한 추세 나 계절성에 의해 불필요하게 영향을받는 자체 유도 다중 회귀 유형을 사용합니다. 이 다중 회귀 기술은 이전 시계열 값, 특히 최신 기간의 값을 기반으로하며 미래의 값을 설명하는 여러 과거 값 사이에서 매우 흥미로운 "상호 관계"를 추출 할 수 있습니다.


2

X(Xt+1,,Xt+k)(X1,,Xk)tk. 위키에서 : 고정 프로세스 (또는 엄격한 고정 프로세스 또는 강력한 고정 프로세스)는 시간 또는 공간으로 이동할 때 관절 확률 분포가 변하지 않는 확률 적 프로세스입니다. 따라서 평균 및 분산과 같은 매개 변수 (있는 경우)도 시간이나 위치에 따라 변하지 않습니다. 또한 추기경이 아래에서 올바르게 지적했듯이 자기 상관 함수는 시간에 따라 변하지 않아야합니다 (즉, 공분산 함수가 시간에 따라 일정 함을 의미 함).

ARMA 모델의 정상성에 대한 아이디어는 가역성의 아이디어와 밀접한 관련이 있습니다.

형식의 모형을 고려하십시오.y(t)=1.1y(t1)(11.1B)


1
X

최근 편집에서 2 차 고정 문구에 대한 언급이 손실 된 것 같습니다. 의도적인가요? (내 원래 주석보다 엄격한 정상 성보다는 2 차 정상 성을 향해 지시했다.)
추기경

: 추기경 나는 당신의 의견이 중요하다고 생각하고 무엇이 추측되고 있는지에 대해 더 명확하게 생각합니다. "2 차 고정"이라는 아이디어가 명확성을 더한다고 생각한다면 간단한 영어로 빛을 비추는 방식으로 답변에 추가하도록 도와주세요.
IrishStat

-2

ARMA와 ARIMA는 시리즈가 정지 상태라는 가정하에 구축되었습니다. 계열이 아닌 경우 예측이 올바르지 않습니다.

표본 통계 (평균, 분산, 공분산)는 계열이 정지 된 경우에만 미래의 행동을 설명하는 데 유용합니다. 예를 들어, 시간이 지남에 따라 계열이 지속적으로 증가하는 경우 표본 평균 및 분산은 표본 크기에 따라 커지고 향후 기간의 평균 및 분산을 항상 과소 평가합니다. 비 정적 데이터에 맞는 회귀 모형을 추정 할 때는주의해야합니다.


-3

내 견해에서 확률 적 과정은 시간 불변이어야하는 세 가지 통계적 속성에 의해 지배되는 과정이다. 그것들은 평균 분산과 자동 상관 함수이다. 자동 상관 함수 인 세 번째 속성은 시간이 지남에 따라 의존성이 어떻게 쇠퇴 하는지를 알려 주어야합니다 (지연).


5
이것은 확률 론적 프로세스와 고정되는 것을 혼동하기 때문에 근본적인 오류로 시작합니다. 귀하의 답변은 이미 게시 된 내용에 어떤 내용을 추가합니까?
Nick Cox

-3

무엇이든 해결하려면 정적을 사용하여 수학적으로 방정식을 모델링해야합니다.

  1. 이러한 방정식을 풀기 위해서는 독립적이고 고정적이어야합니다 (움직이지 않아야 함)
  2. 고정 데이터에서만 다목적에 대한 통찰력을 얻고 수학적 연산 (평균, 분산 등)을 수행 할 수 있습니다.
  3. 고정되지 않은 상태에서는 데이터를 얻기가 어렵습니다.

전환 과정에서 추세와 계절성이 나타납니다.


2
당신의 대답은 말이되지 않습니다. 질문의 전제가 잘못되었습니다. 많은 시계열은 이론적으로나 관측 적으로 고정되지 않은 것으로 간주 될 수 있습니다. 예를 들어 이것을 처리하는 많은 방법이 있습니다! 사인파와 같은 주기적 구성 요소를 포함하여 시리즈 또는 2.
Michael Chernick

@MichaelChernick 차별화 및 계절별 차이 동안 고정되지 않은 시리즈를 고정 시리즈로 변환합니다. 나는 많은 시간이 시리즈는 비 고정 것을 요점을 허용하지만 수학적으로 우리가 하나가 바로 정지로 변환 할 필요가 해결
saravanan saminathan
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.