ACF 및 PACF 플롯 분석


21

ACF 및 PACF 플롯을 올바르게 분석하고 있는지 확인하고 싶습니다.

여기에 이미지 설명을 입력하십시오

배경 : (Reff : 1998 년 필립 한스 프랜시스)

  1. ACF와 PACF 모두 중요한 값을 보여 주므로 ARMA 모델이 내 요구를 충족시킬 것이라고 가정합니다.

  2. ACF는 MA- 부분, 즉 q- 값을 추정하는데 사용될 수 있고, PACF는 AR- 부분, 즉 p- 값을 추정하는데 사용될 수있다

  3. 모델 순서를 추정하기 위해 a.) ACF 값이 충분히 소멸되는지 여부, b) ACF 신호가 과도하게 차이가 나는지 여부 및 c.) ACF 및 PACF가 특정 지연에서 의미 있고 쉽게 해석 할 수있는 피크를 나타내는 지 여부를 살펴 봅니다.

  4. ACF와 PACF는 하나의 모델뿐만 아니라 다른 진단 도구를 고려한 후에 선택해야하는 모델을 제안 할 수 있습니다.

이를 염두에두고 ACF 값이 지연 4에서 사라지고 PACF가 1과 2에서 급격히 증가함에 따라 가장 분명한 모델은 ARMA (4,2) 인 것으로 보입니다.

PACF에서 두 번의 급격한 증가와 ACF에서 한 번의 급격한 상승을 볼 때 ARMA (2,1)를 분석하는 또 다른 방법이 있습니다 (그 후 값이 훨씬 낮은 지점 (0.4)에서 시작).

샘플 평균 예측 결과 (단순 평균 절대 백분율 오류 사용)를 보면 ARMA (2,1)가 ARMA (4,2)보다 훨씬 나은 결과를 제공합니다. 그래서 나는 ARMA (2,1)를 사용합니다!

ACF 및 PACF 플롯 분석의 방법 및 결과를 확인할 수 있습니까?

감사합니다!

편집하다:

기술 통계량 :

count  252.000000
mean    29.576151
std      7.817171
min     -0.920000
25%     26.877500
50%     30.910000
75%     34.915000
max     47.430000

Skewness of endog_var: [-1.35798399]

Kurtsosis of endog_var: [ 5.4917757]

Augmented Dickey-Fuller Test for endog_var: (-3.76140904255411, 0.0033277703768345287, {'5%': -2.8696473721448728, '1%': -3.4487489051519011, '10%': -2.5710891239349585}

시계열 :

여기에 이미지 설명을 입력하십시오

잔차 (ARMA (2,1) :

여기에 이미지 설명을 입력하십시오

잔차의 ACF / PACF :

여기에 이미지 설명을 입력하십시오

편집 II :

데이터:

14.37561
23.95561
25.41561
13.88561
23.31561
33.12561
35.30561
35.78561
37.21561
35.23561
37.34561
38.28561
39.03561
36.34561
39.08561
39.34561
38.80561
40.10561
34.13561
35.42561
27.29561
34.13561
39.89561
47.77561
40.57561
36.15561
33.66561
30.97561
24.90561
23.41561
0.31561
8.45561
37.36561
33.40561
13.97561
11.62561
35.07561
36.15561
37.09561
36.95561
37.85561
32.31561
35.41561
36.35561
37.34561
35.90561
37.40561
36.44561
37.37561
36.16561
35.24561
38.47561
39.18561
39.61561
29.55561
35.50561
38.05561
40.32561
44.39561
37.65561
46.27561
29.41561
40.41561
33.44561
37.04561
35.34561
25.24561
30.23561
15.40561
26.79561
35.38561
40.22561
43.14561
36.96561
41.93561
11.30561
6.87561
32.92561
34.54561
38.27561
36.40561
25.44561
37.26561
26.39561
31.13561
35.90561
38.41561
33.66561
33.16561
31.96561
30.34561
37.77561
32.25561
33.21561
38.37561
36.63561
40.78561
35.60561
36.37561
34.42561
42.67561
33.40561
31.49561
24.81561
23.82561
37.34561
30.73561
21.04561
18.20561
27.36561
18.49561
25.41561
27.92561
29.42561
25.91561
27.56561
28.69561
29.89561
31.47561
29.34561
25.35561
21.98561
28.61561
33.87561
20.07561
27.36561
26.48561
20.37561
22.33561
28.52561
21.24561
10.77561
18.69561
30.19561
33.89561
29.81561
27.55561
22.37561
20.32561
22.43561
31.89561
32.10561
27.67561
36.93561
36.51561
26.96561
21.27561
34.68561
34.13561
35.80561
25.38561
33.42561
9.28561
8.70561
30.36561
30.29561
29.56561
28.41561
33.40561
18.47561
16.48561
18.51561
26.35561
25.40561
19.92561
21.26561
10.90561
32.71561
26.71561
29.99561
28.87561
28.55561
14.07561
10.97561
24.92561
26.40561
21.40561
29.08561
30.18561
30.27561
16.15561
21.96561
32.29561
29.57561
30.24561
30.82561
28.83561
27.30561
26.53561
28.39561
29.76561
29.50561
31.81561
34.79561
24.14561
31.34561
33.14561
35.04561
33.20561
33.53561
35.28561
29.84561
35.02561
33.63561
35.65561
35.73561
35.35561
37.18561
27.38561
34.40561
33.69561
29.05561
34.55561
31.76561
30.91561
34.70561
35.87561
28.31561
30.39561
28.03561
30.72561
30.57561
23.93561
25.11561
32.15561
26.74561
28.76561
32.49561
34.79561
27.90561
33.05561
29.50561
31.67561
34.36561
36.88561
32.31561
26.24561
26.66561
33.59561
37.64561
38.26561
36.20561
33.27561
29.94561
29.19561
27.41561
37.24561
36.26561
30.84561
35.46561
32.24561
31.44561
33.40561
30.71561
33.03561
36.43561
33.44561
22.32561
18.65561
31.97561
27.00561
29.66561
30.76561
33.44561
29.19561
12.32561
33.41561
37.13561
33.43561
37.35561
40.17561
29.38561
19.70561
35.44561
30.48561
30.72561
16.09561
30.82561
30.55561
34.38561
35.45561
34.87561
33.78561
33.87561
29.83561
26.35561
26.44561
28.72561
30.85561
28.18561
12.18561
31.82561
18.01561
27.57561
29.38561
20.32561
22.36561
34.01561
34.40561
20.23561
-0.57439
9.87561
29.55561
31.01561
30.00561
28.12561
13.47561
7.42561
22.01561
20.38561
27.57561
31.54561
29.90561
16.40561
21.27561
26.22561
31.47561
31.11561
32.97561
32.34561
29.36561
32.40561
31.16561
32.05561
31.78561
32.34561
33.87561
31.80561
29.90561
30.09561
32.36561
28.15561
26.30561
15.32561
31.03561
33.47561
33.44561
33.71561
28.30561
12.70561
10.17561
43.96561
9.58561
35.38561
33.82561
41.37561
33.40561
33.64561
20.30561
27.85561
29.01561
32.36561
28.33561
29.90561
27.19561
0.39561
8.40561
0.24561
11.87561
29.15561
20.40561
0.42561
29.29561
23.39561
19.36561

데이터는 약간 왼쪽으로 치우쳐 보일 수 있습니다. 잔차, 아마도 조건부 이분산성에 잠재적 인 문제가있는 것처럼 보입니다.
Glen_b-복지 주 모니카

내 의견으로는 왜도는 원래 데이터의 분석을 통해서만 확인할 수있는 비정상적인 값 (펄스)을 제안합니다.
IrishStat

답변:


8

ACF와 PACF를 살펴보면 분석의 전체 맥락에서 유용합니다. Ljung-Box Q- 통계; p- 값; 신뢰 구간, ACF 및 PACF를 함께보아야합니다. 예를 들어 Q 테스트는 다음과 같습니다.

acf, ci, Q, pvalue = tsa.acf(res1.resid, nlags=4,confint=95,  qstat=True, unbiased=True)

여기-자기 상관에 대한 우리의 Q 테스트는 우리의 그래픽 해석에 대한 전반적인 검사입니다.

Statsmodels의 시계열 분석에 대한 초안 : http://conference.scipy.org/proceedings/scipy2011/pdfs/statsmodels.pdf


14

60 년대 중반에 제안 된 도구를 사용하여 ACF 및 PACF에 대한 유일한 의존은 시뮬레이션 데이터를 제외하고 때로는 거의 정확하지 않습니다. AIC / BIC와 같은 모델 식별 도구는 유용한 모델을 거의 정확하게 식별하지 않으며 가정에 관한 작은 글씨를 읽지 않을 때 발생하는 상황을 보여줍니다. 나는 당신이 가능한 한 간단하게 시작하지만 너무 간단하지는 않지만 잠정적 인 모델을 추정 할 것을 제안한다. Glen_b가 제안한 AR (1). 이 임시 모델의 잔차 / 분석을 사용하여 잠재적 인 모델 확대 또는 모델 단순화를 제안하는 또 다른 ACF 및 PACF를 계산할 수 있습니다. 해석은 참고 문헌과 유사하지만 현재 시리즈 / 잔여 물에는 결정적 구조가 없어야합니다 (예 : 펄스, 레벨 이동, 로컬 시간 추세 및 계절 펄스 및 또한 계열에 오류 오차가 일정하며 임시 모델의 매개 변수가 시간에 따라 변하지 않습니다. 원하는 경우 데이터를 게시 할 수 있으며 유용한 모델을 만드는 데 도움을 줄 수 있습니다.

보고 된 데이터 편집 후 :

365 개의 값이 전달 및 분석되어 식별 된 펄스 및 2 레벨 이동을 갖는 다음 AR (1) 모델을 산출했습니다. 여기에 이미지 설명을 입력하십시오. 이것은 대중적인 추측 이었다는 것을 주목하십시오. 이 모델의 잔차가 여기에 표시 여기에 이미지 설명을 입력하십시오됩니다. 분산 이분산성에 대한 제안이 있지만 이것은 증상이며 궁극적으로 찾을 정확한 치료법을 찾아야합니다. 여기에 표시된 잔차의 acf를 진행하면 여기에 이미지 설명을 입력하십시오모델이 부적절하다는 것을 알 수 있습니다. 잔차의 acf 표를 자세히 보면 여기여기에 이미지 설명을 입력하십시오지연 7과 14에서 구조 제안 두 개의 단서 (샘플 크기 365와 상당한 주간 지연 시간 7 구조)를 결합하여 이것이 실제로 일일 데이터인지 여부를 조사하기로 결정했습니다. 새로운 사용자는 종종 컴퓨터가 모든 것을 알아낼 수있을 정도로 똑똑해야한다는 잘못된 전제에서 데이터를 정의 할 때 매우 중요한 정보를 생략합니다. 지연 7 및 지연 14 단서는 OP 'S ACF 및 PACF 플롯에서 늪이되었습니다. 잔차에 결정 론적 구조가 존재하면 오차 분산이 증가하여 acf가 억제됩니다. 일단 이상치 / 펄스 / 레벨 이동이 확인되면 acf는 자기 회귀 적 구조 / 일일 지표가 존재한다는 사실을 밝혀 내고이를 설명해야합니다.

그런 다음 소프트웨어가 매일 데이터라는 단서로 진행할 수 있도록 데이터를 분석했습니다. 365 개의 값만 있으면 1 년 이상의 데이터로 가능한 계절 / 휴일 예측 변수를 포함하는 모델을 올바르게 구성 할 수 없습니다.

발견 된 모델은 여기에 여기에 이미지 설명을 입력하십시오5 개의 일일 인형, 2 개의 레벨 시프트, 다수의 펄스 및 (1,0,0) (1,0,0) 형식의 arima 모델을 포함합니다. 잔차 그림은 더 나은 모델이 적용됨에 따라 불일치 구조를 더 이상 증명하지 않습니다. 여기에 이미지 설명을 입력하십시오. 목 여기에 이미지 설명을 입력하십시오잔차의 전자 ACF 훨씬 청소기입니다. Actual / Cleansed 그래프는 비정상적인 맥박 포인트를 강조 표시합니다. 여기에 이미지 설명을 입력하십시오. 여기서의 교훈은 매일 시계열이라는 중요한 정보없이 데이터를 분석 할 때 부적절한 표현 (또는 일일 단서에 대한 고급 지식)을 반영하는 수많은 펄스가 있다는 것입니다. 실제 / 적합 및 예측이 여기에 표시됩니다 여기에 이미지 설명을 입력하십시오.

다른 사람들이 동일한 데이터 세트로 무엇을하는지 보는 것이 흥미로울 것입니다. 모든 분석은 상용 소프트웨어를 사용하여 핸즈프리 모드로 수행되었습니다.


1
이른 아침 잘못 읽었습니다 ... 일반적으로 내 그래프에서 lag (0)를 보지 마십시오
IrishStat

1
처음에는 나를 속였다.
Glen_b-복지 주 모니카

답변 주셔서 감사합니다. 시계열 예측 분야에 경험이없는 사람은 공식적으로 올바른 방법이 없기 때문에 올바른 모델을 선택하는 절차를 완전히 이해하기가 어렵습니다. 불행히도 나는 원시 데이터를 게시 할 수 없습니다. 추가 정보가 도움이되기를 바랍니다 ( '편집 :'참조)
Peter Knutsen

데이터를 제시하기 전에 스케일링 / 마스크 할 수 있습니다. 줄거리를 보면, 처리되지 않은 하향 조정이 acf를 편향시키고 pacf가 부족함을 잘못 제안하는 비정상적인 값이있을 수 있습니다. 하향 추세에 대한 시각적 제안이 있고 추세가 없지만 현재로서는 추측에 불과합니다.
IrishStat

방금 사용할 데이터를 추가했습니다.
Peter Knutsen

11

지연 0에서 스파이크를 계산하는 것처럼 보입니다.

PACF는 지연 1에서 합리적으로 큰 스파이크를 보여 AR (1)을 제안합니다. 이것은 물론 ACF의 기하학적 인 감소를 유도 할 것입니다. AR과 MA 모두 동일한 의존성을 두 번 맞추려고하는 것 같습니다.

나는 AR (1)을 시작하여 걱정할만한 가치가있는 것이 있는지 보았습니다.


베드로; 내 대답에는 오타가 있습니다 (마지막 단락에서 AR (1)이 정확했지만 두 번째 단락에서 MA (1)을 입력했습니다).
Glen_b-복지 주 모니카

답변 주셔서 감사합니다. 지연 0부터 계산하는 것은 물론 중요한 실수입니다! AR (1)을 시도했는데 결과가 ARMA (2,1)만큼 좋지 않았습니다!
Peter Knutsen

그것이 좋지 않은 경우도 있지만 AR (1)이 시작될 곳입니다. 예를 들어 잔차의 PACF는 어떻게 생겼습니까? 원본 시리즈는 어떻게 생겼습니까? 데이터의 ACF 및 PACF에서 쉽게 수집 할 수없는 일이 많이 있습니다.
Glen_b-복지 주 모니카

감사. 새로운 통찰력을 얻을 수있는 추가 정보를 게시했습니다.
Peter Knutsen
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.