(팬더) 자기 상관 그래프는 무엇을 보여줍니까?


12

나는 초보자이며 자기 상관 그래프가 보여주는 것을 이해하려고합니다.

페이지 또는 여기에 인용되지 않은 관련 Wikipedia 페이지 와 같은 다른 출처의 여러 설명을 읽었습니다 .

나는이 매우 간단한 코드를 가지고 있는데, 1 년 동안 색인에 날짜가 있고 각 색인에 대해 값이 단순히 0에서 365로 증가합니다. ( 1984-01-01:0, 1984-01-02:1 ... 1984-12-31:365)

import numpy as np
import pandas as pd
from pandas.plotting import autocorrelation_plot
import matplotlib.pyplot as plt

dr = pd.date_range(start='1984-01-01', end='1984-12-31')

df = pd.DataFrame(np.arange(len(dr)), index=dr, columns=["Values"])
autocorrelation_plot(df)
plt.show()

인쇄 된 그래프가있는 곳

여기에 이미지 설명을 입력하십시오

왜부터 그래프가 시작되는지 이해하고 볼 수 있습니다 1.00.

지연이 0 인 자기 상관은 항상 1과 같습니다. 이는 각 항과 자체의 자기 상관을 나타 내기 때문입니다. 지연 시간이 0 인 값과 값은 항상 동일합니다.

이것은 좋지만, 지연 50에서이 그래프의 값이 예를 들어 약 0.65 인 이유는 무엇입니까? 왜 0 이하로 떨어질까요? 내가 가지고있는 코드를 보여주지 않았다면이 자기 상관 그래프가 증가하는 값의 시계열을 보여주는 것으로 추론 할 수 있습니까? 그렇다면 초보자에게 설명하여 어떻게 추론 할 수 있습니까?

답변:


12

지연 자기 공분산 함수 추정값을 살펴 보는 것이 유용 할 수 있습니다 (자기 상관 함수는 단순히 자기 공분산 함수의 축소 버전 임).h

γ^(h)=1nt=1nh(xt+hx¯)(xtx¯)

아이디어는 각 지연 에 대해 계열을 살펴보고 데이터 포인트 시간이 코 바리를 양수 또는 음수로 멀어지게 하는지 여부를 확인합니다 (즉, 가 계열의 평균을 초과 할 때 도 위 또는 아래로 이동 함). ?).hhtt+h

귀하의 시리즈는 단조 증가하는 시리즈이며 평균 입니다. 일 때 어떻게되는지 봅시다 .183h=130

먼저 , 일 때 시점 234까지만 자기 공분산 함수를 계산할 수 있습니다 .t=234t+h=365

또한 부터 까지 , 도 평균보다 낮습니다 (53 + 130 = 183이므로 계열의 평균 임).t=1t=53t+h

그리고 에서 로 추정 된 상관 관계는 음의 값을 갖기 때문에 음의 값이됩니다.t=54t=182

마지막으로 에서 까지 추정 된 상관 관계는 다시 한 번 양의 값을 갖습니다. 와 는 모두 평균보다 높기 때문입니다.t=183t=234tt+h

양의 코발트 포인트와 음의 코발트 포인트에서 자기 공분산 함수에 대략적으로 동일한 기여로 인해 상관 관계가 평균화되는 방법을 알고 있습니까?

양의 코바 인 점보다 음의 코바 인 점이 더 많음을 알 수 있습니다. 그러나 직관적으로 양의 코 버닝 포인트는 평균에서 멀어지기 때문에 더 큰 크기를 나타냅니다. 반면 마이너스 코 벌링 포인트는 평균에 가까워지기 때문에 자기 공분산 기능에 작은 크기를 제공합니다. 따라서, 이것은 약 0의 자기 공분산 함수를 초래합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.