자기 상관과의 관계는 무엇입니까?


13

이를 시작하기 위해 저는 수학적 배경이 매우 깊지 만 시계열이나 통계 모델링을 다루지 않았습니다. 그래서 당신은 나와 함께 매우 부드럽게하지 않아도됩니다 :)

상업용 건물에서 에너지 사용 모델링에 대한이 논문을 읽고 있으며 저자는 다음과 같이 주장합니다.

[자기 상관의 존재]는 모델이 본질적으로 자기 상관 된 에너지 사용의 시계열 데이터로부터 개발 되었기 때문이다. 시계열 데이터에 대한 순전히 결정적인 모델에는 자기 상관이 있습니다. 모델에 [더 많은 푸리에 계수]가 포함되어 있으면 자기 상관이 줄어 듭니다. 그러나 대부분의 경우 푸리에 모델의 CV가 낮습니다. 따라서이 모델은 높은 정밀도를 요구하지 않는 실제 목적에 적합 할 수 있습니다.

0.) "시계열 데이터에 대한 순전히 결정론적인 모델이 자기 상관을 갖는 것"은 무엇을 의미합니까? 자기 상관이 0 인 경우 시계열의 다음 지점을 어떻게 예측할 수 있습니까?와 같이 이것이 의미하는 바를 모호하게 이해할 수 있습니다. 이것은 수학적인 주장이 아니며, 이것이 0 인 이유입니다. :)

1.) 자기 상관이 기본적으로 모델을 죽였다는 인상을 받았지만 그 점을 생각하면 왜 그런지 이해할 수 없습니다. 그렇다면 자기 상관이 왜 나쁜 (또는 좋은) 것입니까?

2.) 자기 상관을 다루는 것으로 들었던 해결책은 시계열을 비교하는 것입니다. 저자의 마음을 읽으려고하지 않고, 왜 한 것이다 되지 무시할 수없는 자기 상관이 존재하는 경우 DIFF는 무엇입니까?

3.) 무시할 수없는 자기 상관은 모델에 어떤 제한을 두는가? 이것은 어딘가의 가정입니까 (즉, 간단한 선형 회귀로 모델링 할 때 정규 분포 잔차)?

어쨌든, 이것이 기본적인 질문이라면 죄송합니다. 도움을 주셔서 감사합니다.

답변:


10
  1. 저자가 아마도 모형 의 잔차 에 대해 이야기하고 있다고 생각합니다 . 푸리에 계수를 더 추가한다는 그의 진술 때문에 나는 이것을 주장한다. 내가 믿는 것처럼, 그가 푸리에 모델을 피팅하고 있다면, 더 많은 계수를 추가하면 더 높은 CV를 희생시키면서 잔차의 자기 상관을 줄일 수 있습니다.

    이를 시각화하는 데 문제가있는 경우 다음 예를 생각해보십시오. 다음과 같은 100 포인트 데이터 세트가 있다고 가정합니다.이 세트는 백색 가우스 노이즈가 추가 된 2 계수 푸리에 모델에서 나온 것입니다.

    데이터 포인트

    다음 그래프는 두 개의 적합치를 보여줍니다. 하나는 2 개의 푸리에 계수로 수행되고 다른 하나는 200 개의 푸리에 계수로 수행됩니다.

    맞다

    보다시피, 200 개의 푸리에 계수는 DATAPOINTS에 더 잘 맞고 2 개의 계수 적합 (실제 모델)은 MODEL에 더 잘 맞습니다. 이는 200 개의 계수가있는 모델이 거의 모든 데이터 포인트에 적합하기 때문에 200 개의 계수가있는 모델의 잔차의 자기 상관이 2 계수 모델의 잔차보다 모든 지연에서 거의 확실히 0에 가깝다는 것을 의미합니다. 거의 모두 0입니다). 그러나 샘플에서 10 개의 데이터 포인트를 떠나 동일한 모델에 적합하면 어떻게 될 것이라고 생각하십니까? 2- 계수 모델은 샘플에서 벗어난 데이터 포인트를 더 잘 예측합니다! 따라서 200 계수 모델과 달리 낮은 CV 오류가 발생합니다. 이것을 오버 피팅 이라고 합니다. 이 '마법'의 배후는 CV가 실제로 측정하려고하는 것은 예측 오차 , 즉 모델이 데이터 세트에없는 데이터 포인트를 얼마나 잘 예측하는지 때문입니다.

  2. 이러한 맥락에서 잔차에 대한 자기 상관은 '나쁜'데, 이는 데이터 포인트 간의 상관 관계를 충분히 모델링하지 않았기 때문입니다. 사람들이 시리즈를 차별화하지 않는 주된 이유 는 기본 프로세스를 그대로 모델링 하기 때문입니다. 주기성 또는 추세를 제거하기 위해 일반적으로 시계열의 한 가지 차이점이 있지만, 해당 주기성 또는 추세가 실제로 모델링하려고하는 것이면 차이를 구분하는 것이 최후의 수단 옵션 (또는 잔차를 모형화하기위한 옵션)처럼 보일 수 있습니다. 더 복잡한 확률 론적 과정).
  3. 이것은 실제로 작업중인 지역에 따라 다릅니다. 결정적 모델에서도 문제가 될 수 있습니다. 그러나 자기 상관의 형태에 따라 깜박임 노이즈, ARMA와 같은 노이즈로 인해 자기 상관이 발생하거나 잔류 기본주기 소스 (이 경우 증가하고 싶을 수도 있음)로 인해 자기 상관이 발생하는 경우 쉽게 볼 수 있습니다. 푸리에 계수의 수).

귀하의 답변에 감사 드리며, 기꺼이 원한다면 한 번에 하나씩 소화하고 싶습니다. 1)의 경우, 더 많은 푸리에 계수를 포함시키는 것이 자기 상관을 줄이고 CV를 증가시키는 이유를 이해하는 직관적 인 방법이 있습니까?
BenDundee

1
예를 추가했습니다. 도움이 되길 바랍니다. 그리고 네, 그는 잔차의 이력서를 말합니다.
Néstor

알았어. 알 겠어. 이것은 2와 관련하여 내가 무엇을 물어볼 것인지와 관련이 있습니다. 상관 관계를 더 잘 이해하기 위해이 모델을 (일반적으로) 패치하는 방법은 무엇입니까? 푸리에 계수의 상관 행렬에 대한 제약 조건을 추가 할 수 있습니까?
BenDundee 2013

1
그것은 나도 어려운 일이다. 특히 주기적 결정적 모델의 경우 어떤 종류의 노이즈 모델을 사용해야하는지 알기가 매우 어렵습니다. 큰 문제는 푸리에 모델의 계수의 수를 미리 알지 못하기 때문에 모델링 해야하는 임의의 변수입니다. 적은 수의 데이터 포인트가있는 경우이를 모델링하기 위해 가역 점프 MCMC를 정의 할 것입니다. 다른 노이즈 모델을 시도하고 AIC / BIC를 비교합니다. 그러나 큰 데이터 세트의 경우 이는 불가능합니다.
Néstor

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.