나는 약한 고정 시계열의 자기 상관 시간에 대한 문헌에서 두 가지 정의를 발견했다
여기서 는 지연 에서의 자기 상관 입니다. k
자기 상관 시간의 한 가지 적용은 "유효한 표본 크기"를 찾는 것 입니다. 시계열에 대한 관측치가 있고 자기 상관 시간 를 알고 있다면τ
평균을 구하기 위해 상관 된 표본 대신 독립된 표본 . 데이터에서 를 추정 하는 것은 쉬운 일이 아니지만 몇 가지 방법이 있습니다 ( Thompson 2010 참조 ).τ
절대 값이없는 정의 는 문헌에서 더 일반적으로 보입니다. 그러나 가능성을 인정합니다 . R과 "coda"패키지 사용 :τ a < 1
require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000) # white noise
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000) # AR(1)
effectiveSize(ts.uncorr) # Sanity check
# result should be close to 10000
effectiveSize(ts.corr)
# result is in the neighborhood of 30000... ???
"coda"의 "effectiveSize"함수는 위의 와 동등한 자기 상관 시간의 정의를 사용합니다 . 효과적인 샘플 크기 또는 자기 상관 시간을 계산하는 다른 R 패키지가 있으며, 내가 시도한 모든 결과는 이와 일치하는 결과를 제공합니다. 음수 AR 계수를 갖는 AR (1) 프로세스 는 상관 관계보다 더 효과적인 샘플을 가지고 있습니다 시계열. 이상해 보인다.
분명히, 이것은 자기 상관 시간 의 정의 에서 결코 일어날 수 없습니다 .
자기 상관 시간의 정확한 정의는 무엇입니까? 효과적인 샘플 크기를 이해하는 데 문제가 있습니까? 위에 표시된 결과는 잘못된 것 같습니다. 무슨 일입니까?