AIC를 최소화하여 모델을 선택하는 것이 언제 적절한가요?


12

적어도 일부 상위 칼리버의 통계 학자들 사이에서, 최소값의 특정 임계 값 내에 AIC 통계치가있는 모델은 AIC 통계를 최소화하는 모델로서 적절하게 고려되어야한다는 것이 잘 확립되어있다. 예를 들어 [1, p.221]에서

그런 다음 작은 GCV 또는 AIC 모델이 가장 좋습니다. 물론 GCV 또는 AIC를 맹목적으로 최소화해서는 안됩니다. 오히려 합리적으로 작은 GCV 또는 AIC 값을 가진 모든 모델은 잠재적으로 적절한 것으로 간주되고 단순성과 과학적 관련성에 따라 평가되어야합니다.

마찬가지로 [2, p.144]에서도

최소값 c의 AIC 값을 가진 모델이 경쟁력있는 것으로 간주되어야한다고 제안되었다 (Duong, 1984) (c = 2를 전형적인 값으로). 경쟁 모델 중에서 선택은 잔차의 백색도 (5.3 절) 및 모델 단순성과 같은 요소를 기반으로 할 수 있습니다.

참고 문헌 :

  1. Ruppert, D .; Wand, MP & Carrol, RJ Semiparametric Regression , Cambridge University Press, 2003
  2. Brockwell, PJ & Davis, RA 시계열 및 예측 소개 , John Wiley & Sons, 1996

따라서 위의 두 가지 모델 중 어느 것이 선호되어야합니까?

print( lh300 <- arima(lh, order=c(3,0,0)) )
# ... sigma^2 estimated as 0.1787:  log likelihood = -27.09,  aic = 64.18
print( lh100 <- arima(lh, order=c(1,0,0)) )
# ... sigma^2 estimated as 0.1975:  log likelihood = -29.38,  aic = 64.76

보다 일반적으로 AIC 또는 관련 통계를 맹목적으로 최소화하여 모델을 선택하는 것이 적절한시기는 언제입니까?


두 모델 모두에 대해 AIC를 제공하지 않았습니다.
Peter Flom

R로 얻는 방법을 보여주었습니다.
Hibernating

1
아래에 언급 된 ARIMA 모델에서 +1 문제 그러나 그렇지 않은 경우 : "예후 모델 단순화 : 임상 데이터를 기반으로 한 시뮬레이션 연구" Ambler 2002가 이에 대한 가장 인용 된 참고 자료입니다.
Charles

답변:


4

에 코스 마 샤 리치의 강의 노트에서 의역 선형 회귀에 대한 진실은 , 그대는 AIC 같은 통계를 최소화하기 위해 일어난 이유만으로 모델을 선택하지 않을 것이다 위해,

Every time someone solely uses an AIC statistic for model selection, an angel loses its
wings. Every time someone thoughtlessly minimises it, an angel not only loses its wings,
but is cast out of Heaven and falls in most extreme agony into the everlasting fire.

1
한 유명한 유대인 말했듯이 : :) "상상력은 지식보다 낫다"
최대 절전 모드

그리고 한 유명한 비 유대인이 말했듯이 "조기 베라"를 보면 많은 것을 볼 수 있습니다.
Peter Flom

물론 우리가 보는 것은 주로 우리가 찾는 것에 달려 있습니다. --John Lubbock
최대 절전 모드

12

나는 종종 모델 선택에 AIC를 사용하는 것이 적절하다고 말하지만 모델 선택의 유일한 기초로 AIC를 사용하는 것은 드물다. 또한 실질적인 지식을 사용해야합니다.

특별한 경우, 3 차 AR과 1 차 AR의 모델을 비교합니다. AIC (또는 이와 유사한 것) 외에도 자기 상관 및 부분적 자기 상관 그림을 살펴 보겠습니다. 또한 3 차 모델이 무엇을 의미 하는지 고려할 것 입니다. 말이 되나요? 실질적인 지식에 추가됩니까? (또는 예측에만 관심이 있다면 예측에 도움이됩니까?)

더 일반적으로, 매우 작은 효과 크기를 찾는 것이 흥미로운 경우가 있습니다.


arima 모델을 선택하기위한 좋은 알고리즘이 AIC (또는 이와 유사한) 기준에만 기반해서는 안된다고 말했습니까?
최대 절전 모드

그렇습니다.
Peter Flom

그리고이 끝에서 나는 auto.arima라고 들었습니다. 내가 선호하는 것은 Bisgaard, S. & Kulahci, M.의 6 장, 2011 년 John Wiley & Sons, Inc., 2011 년에 의한 시계열 분석 및 예측의 6 장에 요약 된 접근법을 따르는 것입니다. 모델의 차이점
최대 절전 모드

1
@Hibernating :의 저자 auto.arima, Hyndman & Khandakar (2008) , 말 : -. "단 변량 시계열 많은 수의 자동 예측은 종종 사업에 필요한이 필요 예측이 달에 1 회 이상 천 제품 라인에 걸쳐있는 것이 일반적이다. 더 적은 수의 예측이 필요한 경우에도 시계열 모델을 사용하여이를 예측하는 데 적합한 교육을받은 사람은 없습니다. 이러한 상황에서 자동 예측 알고리즘은 필수 도구입니다. " 이러한 상황에 유의하십시오 .
Scortchi-Monica Monica 복원

2
고맙지 만 전에 읽었습니다. 현재 "자동"부분의 명백한 문제를 무시하더라도 특히 계절 모델을 포함하도록 확장 된 경우 "arima"부분에 문제가 있습니다. 계절 ARIMA 모델은 PJ Harrison, C Chatfield 및 내가 배우는 것을 즐기게 된 다른 인물들에 의해 강력하게 비판되었습니다. 나는 i) 절대적으로 필요하고 ii) 알고리즘을 기반으로 소리를 찾을 수있을 때 자동 예측에 반대하는 것이 없다. 그렇지 않으면 몇 년 전 Stat Science의 Leo Breiman의 "두 문화"논문에 대한 그의 의견에서 DR Cox의 조언을 따른다.
동면

8


2
마지막 문장이 흥미 롭습니다. 나는 궁극적 인 목적이 예측이라면 미미한 예측 변수조차 회귀에 추가하는 것이 정당화 될 수 있다는 것을 읽었습니다. 나는 당시에 그것에 많은 관심을 기울이지 않았지만 이제는 그 참고 문헌을 찾으려고 노력할 것입니다.
동면

3
대신에 추가 내가 말을 피하기 제거 . 또한 예측뿐만 아니라 통계적 연관성 평가를 사용하여 변수 선택을 유도하면 편향과 유효하지 않은 표준 오류 및 신뢰 한계가 발생합니다.
Frank Harrell
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.