시계열 모델에서 적절한 지연 순서를 선택하기 위해 왜 정보 기준 (조정되지 않은 )이 사용됩니까?


9

ARMA-GARCH와 같은 시계열 모델에서는 적절한 지연 또는 모델 순서를 선택하기 위해 AIC, BIC, SIC 등과 같은 다른 정보 기준이 사용됩니다.

내 질문은 매우 간단합니다. 왜 우리는 조정 된 R2 를 사용 하여 적절한 모델을 선택하지 않습니까? 조정 된 R ^ 2 값을 높이는 모델을 선택할 수 있습니다 R2. 조정 된 R2 와 정보 기준은 모두 모델의 추가 회귀 자 수에 대해 불이익을주기 때문에 이전의 R2 불이익을 가한 후 우도 값에 불이익을줍니다.


답변에 뭔가 빠졌을 수 있지만 (아래) R- 제곱 및 조정 R- 제곱은 상대적으로 제한된 OLS 추정 모델에 적합하지만 AIC, BIC 등은 더 넓은 종류의 일반화 선형에 적합합니다. ML 또는 변형으로 추정 된 모델.
Mike Hunter

답변:


12

적어도 AR 모델과 같은 선형 모델을 논의 할 때 조정 된 R2 와 AIC는 다르지 않다고 주장합니다.

가 포함되어야 하는지에 대한 질문을 고려하십시오 . 모델 입니다. 우리는 말 는 IS 진정한 모델 의 경우 . 공지 사항이 . 따라서 모델은 중첩 됩니다. 모델 선택 절차 은 여러 모델 중 가장 타당한 모델을 선택하는 데이터 종속 규칙입니다.X2

y=X1(n×K1)β1+X2(n×K2)β2+ϵ
M1:y=X1β1+uM2:y=X1β1+X2β2+u,
E(u|X1,X2)=0M2β20M1M2M^

우리는 말을 입니다 일관 경우 M^

limnP(M^=M1|M1)=1limnP(M^=M2|M2)=1

조정 된 고려하십시오 . 즉, 경우 선택하십시오 . 마찬가지로 단조로 감소 이 절차를 최소화하는 것과 동일 . 이는 를 최소화하는 것과 같습니다 . 충분히 큰 의 경우 후자는 여기서R2M1R¯12>R¯22R¯2s2s2log(s2)n

log(s2)=log(σ^2nnK)=log(σ^2)+log(1+KnK)log(σ^2)+KnKlog(σ^2)+Kn,
σ^2오차 분산의 ML 추정기입니다. 따라서 기반으로 하는 모델 선택은 가장 작은 모델을 선택하는 것과 같습니다 . 이 절차는 일치하지 않습니다.R¯2log(σ^2)+K/n

제안 :

limnP(R¯12>R¯22|M1)<1

증명 : 여기서 선형 회귀 분석에서 통계는 LR 통계이기 때문에 두 번째-마지막 줄은 다음과 같습니다. 널 분배. QED

P(R¯12>R¯22|M1)P(log(s12)<log(s22)|M1)=P(nlog(s12)<nlog(s22)|M1)P(nlog(σ^12)+K1<nlog(σ^22)+K1+K2|M1)=P(n[log(σ^12)log(σ^22)]<K2|M1)P(χK22<K2)<1,
χK22

이제 Akaike의 기준 인 고려해보십시오. 따라서 AIC는 "벌칙 기간에 대한 추가 회귀자가 암시하는 SSR 감소도 해결합니다" , '반대 방향을 가리 킵니다. 따라서 인 경우 선택하고 그렇지 않으면 선택하십시오 .

AIC=log(σ^2)+2Kn
M1AIC1<AIC2M2

하여 3 번 줄에서 위의 증명을 계속 하면 가 일치하지 않는 것을 알 수 있습니다. . 따라서 조정 된 와 는 이 실제 모델 이더라도 양수 확률로 "대형"모델 을 선택합니다 .AICP(nlog(σ^12)+2K1<nlog(σ^22)+2(K1+K2)|M1)R2AICM2M1

AIC의 복잡성에 대한 패널티는 조정 된 보다 약간 크므 로 지나치게 선택하기가 쉽지 않을 수 있습니다. 그리고 그것은 내 게시물에서 다루지 않은 다른 좋은 속성 (KL이 실제 모델로 간주되지 않으면 KL의 발산을 최소화하는 것으로 간주)을 가지고 있습니다.R2


1
좋은 답변 : 너무 무겁지는 않지만 여전히 정확합니다! 어제 거기 있었다면 나는 내 글을 게시하지 않았을 것입니다.
Richard Hardy

ARMA-GARCH의 경우는 어떻습니까? 어떻게 것 MA와 GARCH 용어 amung 선택에서 무엇입니까? Radj2
Zachary Blumenfeld

나는 감히 말하지 않을 것입니다. 설명 하듯이 R2가 그러한 모델에 적합하다는 것이 무엇인지 명확하지 않습니다.
Christoph Hanck

5

의 페널티 는 AIC 또는 BIC가 제시 한 모델 선택 측면에서 훌륭한 속성을 제공하지 않습니다. 의 페널티 는 회귀자가 실제로 모델에 속하지 않을 때 모집단의 추정치 로 만들기에 충분합니다 (Dave Giles의 블로그 게시물 "In What Sense "조정 된"R- 제곱 편견이 있습니까? "" "조정 된"결정 계수의 특성에 대한 추가 정보 " ); 그러나 는 최적의 모델 선택기가 아닙니다.Radj2Radj2Radj2R2Radj2

(모순으로 증거가있을 수 있습니다. 어떤 의미에서 AIC가 최적이고 다른 방법으로 BIC가 최적이고 가 둘 중 어느 것과도 일치하지 않으면 도 최적이 아닙니다. 이 두 감각의.)Radj2Radj2


증가 하기 전에 몇 개의 GARCH 매개 변수를 추가해야 합니까? :) .... (MA 모델에서와 같이) 상관 오차를 가정 할 때 비슷한 주장을 할 수 있다고 생각합니다 .GLS 모델은 일반 최소 제곱에 대한 제곱 잔차의 합을 줄이지 않습니다. MA와 GARCH 모두에서 매개 변수 (설명 변수가 아닌 가 조정 됨)가 모델에 추가됩니다. MA 및 GARCH 매개 변수는 을 줄이기 위해 추가되지 않으며 , iid 오류 항의 부족을 반영하기 위해 가중 제곱 잔차 의 가중 합을 감소시키기 위해 다시 추가됩니다 . R2R2adjSSR
Zachary Blumenfeld

이것은 실제로 원래 게시물이나 내 답변을 다루고 있습니까? 어쨌든, 나는 당신의 요점에 동의합니다.
Richard Hardy

내가 지적하려고했던 것은 그 정말이의 비율을 기준으로하기 때문에 (너무 가능성이 MA 구성 요소) GARCH 구성 요소에 따라 선택하는 데 사용할 수 없습니다 이상 추정량을 바이어스된다 오차항이 iid가 아닌 경우 분산 (이것은 당신이 이야기 할 때 편향의 특정 사례 일뿐입니다). ARMA-GARCH의 경우 증가하지 않기 때문에 데이터에 확률 변동성이 있어도 GARCH 구성 요소가있는 모델을 선택하지 않습니다 . 기본적으로 구체적인 예를 제시하여 귀하에게 동의합니다. Radj2SSTSSRSSTR2
Zachary Blumenfeld
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.