시계열과 회귀의 관계 및 차이점은 무엇입니까?


12

시계열과 회귀의 관계와 차이점은 무엇입니까?

들면 모델 가정 회귀 모델의 입력 변수의 다른 값에 대한 출력 변수 간의 독립성을 가정하는 시계열 모형은하지 않지만 그것은 정확? 다른 차이점은 무엇입니까?

방법 에 대해서는 Darlington의 웹 사이트 에서

시계열 분석에는 여러 가지 접근 방법이 있지만 가장 잘 알려진 두 가지 방법은 회귀 방법과 Box-Jenkins (1976) 또는 ARIMA (AutoRegressive Integrated Moving Average) 방법입니다. 이 문서는 회귀 분석법을 소개합니다. 세 가지 주요 이유로 회귀 방법이 ARIMA보다 훨씬 우수하다고 생각합니다

웹 사이트에 시계열에 대한 "회귀 방법"이 무엇인지, Box-Jenkins 또는 ARIMA 방법과 어떻게 다른지 잘 모르겠습니다. 누군가가 그 질문에 대한 통찰력을 줄 수 있다면 고맙습니다.

감사합니다.


2
여기에있는 대부분의 답변과 의견은 더 구체적인 질문에 초점을 맞 춥니 다. 이것은 시계열 분석이 Box-Jenkins 또는 ARIMA보다 훨씬 더 중요하다는 플래그 일뿐입니다. 시계열 분석의 전체 분야는 상당히 다른 (또는 적어도 더 일반적인) 초점을 가지고 있습니다. 관찰되지 않은 구성 요소 모델은 몇 가지 예 중 하나 일뿐입니다.
닉 콕스

답변:


17

나는 이것이 좋은 질문이라고 생각하며 대답을받을 가치가 있습니다. 제공된 링크는 일부자가 추출 방법이 Box-Jenkins보다 시계열 분석을 수행하는 더 좋은 방법이라고 주장하는 심리학자에 의해 작성되었습니다. 나는 대답을 시도 할 때 시계열에 대해 더 잘 알고있는 다른 사람들이 참여할 수 있기를 바랍니다.

zt=α1zt1++αkztk+εt
ztzt12kar함수. 나는 그것을 테스트했고, R에 AR 모델을 맞추기위한 기본 방법에 비슷한 대답을하는 경향이 있습니다.

zttt

그러나 그는 또한 과적 합을 옹호 한 다음 적합 된 계열과 데이터 간의 평균 제곱 오차 감소를 그의 방법이 더 낫다는 증거로 사용하는 것처럼 보입니다. 예를 들면 다음과 같습니다.

나는 코렐로 그램이 더 이상 사용되지 않는다고 생각합니다. 그들의 주요 목적은 작업자가 어떤 모델이 데이터에 가장 잘 맞는지를 추측하는 것이었지만 현대 컴퓨터의 속도 (최소한 시계열 모델 피팅이 아닌 경우 회귀)는 작업자가 여러 모델을 간단히 맞추고 정확히 어떻게 각각은 평균 제곱 오차로 측정 된대로 적합합니다. [두 가지 방법이이 문제에 똑같이 취약하기 때문에 우연한 자본화 문제는이 선택과 관련이 없습니다.]

모델의 테스트는 기존 데이터에 얼마나 잘 맞는지가 아니라 모델을 얼마나 잘 예측할 수 있어야하므로 좋은 생각이 아닙니다. 그의 세 가지 예에서, 그는 "조정 된 근 평균 제곱 오차"를 적합의 품질에 대한 그의 기준으로 사용합니다. 물론, 과적 합 모델은 표본 내 오차 추정치를 더 작게 만들 것이므로, 그의 RMSE가 더 작기 때문에 그의 모델이 더 낫다는 주장은 잘못입니다.

간단히 말해서, 그는 모델이 얼마나 좋은지 평가하기 위해 잘못된 기준을 사용하고 있기 때문에 회귀 분석과 ARIMA에 대한 잘못된 결론에 도달합니다. 그가 대신 모델 의 예측 능력을 테스트했다면 ARIMA가 맨 위에 나왔을 것입니다. 아마 그가 여기 언급책에 접근 할 수 있다면 그것을 시도해 볼 수있을 것이다 .

[보충 : 회귀 아이디어에 대한 자세한 내용은 ARIMA가 가장 대중화되기 전에 작성된 오래된 시계열 책을 참조하십시오. 예를 들어, Kendall, Time-Series , 1973, 11 장에는이 방법과 ARIMA와의 비교에 대한 전체 장이 있습니다.]


문제는 (내재 된) 차이점은 무엇입니까?
hbaghishani

필자가 필자가 말할 수있는 한 동료 검토 간행물에서 자신의자가 양조 방법을 설명하지 않았으며 통계 문헌에 대한 언급은 최소한으로 보였으며 방법론 주제에 대한 그의 주요 간행물은 70 년대로 거슬러 올라갑니다. 엄밀히 말해서,이 중 어느 것도 클레임을 스스로 평가할 충분한 시간이나 전문 지식 없이는 아무것도“증명”하지 못합니다.
Gala

@hbaghishani 실질적인 차이점은 자동 상관 데이터, 즉 각 계열 내에서 상호 상관 해석을 왜곡한다는 점입니다. 또한 가우스 위반 (Gussian Violations), 예를 들어, 부식의 일정한 평균, 시간에 따른 일정한 분산, 시간에 따른 일정한 파라미터는 고려 / 정정되어야합니다.
IrishStat

@flounderer 사람들은 판매하고 보상을 얻기 위해 교과서를 작성합니다. 그것들은 때때로 초기에 그들이 정확하다고 생각 되었기 때문에 잘못 가르치는 구식적인 방법들을 포함합니다. 판매량을 늘리기 위해 게시자는 종종 내 개인적인 경험에서 구식이지만 잘못된 방법론을 요구합니다.
IrishStat

@IrishStat 모델링 자동 상관 데이터는 동적 회귀 모델에 의해 수행 될 수 있습니다. 또한 혼합 모델과 같은 다른 모델도 이러한 데이터에 사용될 수 있습니다. 따라서이 기능이 실질적인 차이점이라고 생각하지 않습니다.
hbaghishani

7

E. Parzen 교수는 Box와 Jenkins의 혁신적인 방법을 제안하지 않았을 지 모를 정도로 부러워 할 것입니다. 펄스, 레벨 시프트, 계절 펄스 및 로컬 시간 추세를 식별하고 수정하지 않는 등 여러 가지 이유로 (Flounderer가 훌륭하게 요약 한) 여러 가지 이유로 실패합니다. 또한 시간에 따른 매개 변수 변경 또는 시간에 따른 오류 분산의 변경을 고려해야합니다.

나는 당신이 관심을 가질만한 작품을 썼다. "회귀 vs 박스-젠킨스"라고하며 http://www.autobox.com/cms/index.php/afs-university/intro-to-forecasting 에서 구할 수있다 / doc_download / 24- 회귀 -vs-box-jenkins

Darlington의 절차에 대한 한 의견은 시간, 시간 * 시간, 시간 * 시간 * 시간 * 시간을 예측 인자로 반영합니다. 이상치 효과의 격리로 이어지는 중재 탐지가 없으면 더 높은 시간의 힘을내는 것이 가능합니다. 뇌 수술을 수행하는 통계학자를 조심할 것이므로 통계 분석을 수행하는 비 통계학자를주의하십시오. 공평하게도 시계열 분석에 대한 제한된 훈련으로 시계열 분석을 수행하려는 비 계열 통계 학자 / 수학자를 조심해야 할 수도 있습니다.

이 목록의 다른 포스터 (특히 whuber)는 대부분 "단 변량 (univariate) 환경에서이"접근 방식 "을 사용하지 말 것을 반복해서 경고했습니다. 이 경고는 인과 모델에도 적용됩니다.

도움이 되었기를 바랍니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.