적어도 AR 모델과 같은 선형 모델을 논의 할 때 조정 된 R2 와 AIC는 다르지 않다고 주장합니다.
가 포함되어야
하는지에 대한 질문을 고려하십시오
. 모델
입니다. 우리는 말 는 IS 진정한 모델 의 경우 . 공지 사항이 . 따라서 모델은 중첩 됩니다. 모델 선택 절차 은 여러 모델 중 가장 타당한 모델을 선택하는 데이터 종속 규칙입니다.X2
y=X1(n×K1)β1+X2(n×K2)β2+ϵ
M1M2::y=X1β1+uy=X1β1+X2β2+u,
E(u|X1,X2)=0M2β2≠0M1⊂M2Mˆ
우리는 말을
입니다 일관 경우
Mˆ
limn→∞P(Mˆ=M1|M1)limn→∞P(Mˆ=M2|M2)==11
조정 된 고려하십시오 . 즉, 경우 선택하십시오 . 마찬가지로 단조로 감소 이 절차를 최소화하는 것과 동일 . 이는 를 최소화하는 것과 같습니다 . 충분히 큰 의 경우 후자는
여기서R2M1R¯21>R¯22R¯2s2s2log(s2)n
log(s2)==≈≈log(σˆ2nn−K)log(σˆ2)+log(1+Kn−K)log(σˆ2)+Kn−Klog(σˆ2)+Kn,
σˆ2오차 분산의 ML 추정기입니다. 따라서 기반으로 하는 모델 선택은 가장 작은 모델을 선택하는 것과 같습니다
. 이 절차는 일치하지 않습니다.
R¯2log(σˆ2)+K/n
제안 :
limn→∞P(R¯21>R¯22|M1)<1
증명 :
여기서 선형 회귀 분석에서 통계는 LR 통계이기 때문에 두 번째-마지막 줄은 다음과 같습니다. 널 분배. QED
P(R¯21>R¯22|M1)≈=≈=→<P(log(s21)<log(s22)|M1)P(nlog(s21)<nlog(s22)|M1)P(nlog(σˆ21)+K1<nlog(σˆ22)+K1+K2|M1)P(n[log(σˆ21)−log(σˆ22)]<K2|M1)P(χ2K2<K2)1,
χ2K2
이제 Akaike의 기준 인 고려해보십시오.
따라서 AIC는 "벌칙 기간에 대한 추가 회귀자가 암시하는 SSR 감소도 해결합니다" , '반대 방향을 가리 킵니다. 따라서 인 경우
선택하고 그렇지 않으면 선택하십시오 .
AIC=log(σˆ2)+2Kn
M1AIC1<AIC2M2
하여 3 번 줄에서 위의 증명을 계속 하면 가 일치하지 않는 것을 알 수 있습니다. . 따라서 조정 된 와 는 이 실제 모델 이더라도 양수 확률로 "대형"모델 을 선택합니다 .AICP(nlog(σˆ21)+2K1<nlog(σˆ22)+2(K1+K2)|M1)R2AICM2M1
AIC의 복잡성에 대한 패널티는 조정 된 보다 약간 크므 로 지나치게 선택하기가 쉽지 않을 수 있습니다. 그리고 그것은 내 게시물에서 다루지 않은 다른 좋은 속성 (KL이 실제 모델로 간주되지 않으면 KL의 발산을 최소화하는 것으로 간주)을 가지고 있습니다.R2