모델 선택의 AIC 지침


32

필자는 일반적으로 BIC를 AIC보다 parsimony를 더 중요하게 생각한다는 점을 이해하고 있습니다. 그러나 지금은보다 포괄적 인 접근 방식을 사용하기로 결정했으며 AIC도 사용하고 싶습니다. 나는 Raftery (1995)가 BIC 차이에 대한 훌륭한 지침을 제시했다는 것을 알고있다.

나는 교과서를 보았고 AIC에서 이상하게 보였습니다 (더 큰 차이는 약하고 AIC의 작은 차이는 하나의 모델이 더 좋습니다). 이것은 내가 배운 것을 알고있는 것에 위배됩니다. 내 이해는 더 낮은 AIC를 원한다는 것입니다.

Raftery의 지침이 AIC에도 적용되는지, 또는 한 모델과 다른 모델에 대한 "증거 강도"에 대한 지침을 인용 할 수있는 곳이 있습니까?

그리고 예, 컷오프는 크지 않지만 (내가 자극적이라고 생각하지만) 다른 종류의 증거를 비교할 때 도움이됩니다.


1
이 (PDF) , 당신이 참조하는 Raftery 종이?
gung-Monica Monica 복원

4
여기 독자들은 다음과 같은 우수한 CV 스레드를 읽을 수 있습니다 . AIC 또는 BIC를 다른 것보다 선호하는 이유가 있습니까?
gung-Monica Monica 복원

1
" 교과서를 보았는데 AIC에서 이상하게 보인 것 같습니다 (더 큰 차이는 약하고 AIC의 작은 차이는 하나의 모델이 더 낫다는 것을 의미합니다) "--- 그리고 실제로 무엇을 하는가? 말하다?
Glen_b-복지 주 모니카

1
두 번째 파라는 불분명합니다. 큰 차이는 더 작은 값을 가진 모델이 바람직하다는 것을 나타내지 만 작은 차이는 평가하기가 어렵습니다. 또한, 통계는 차이가 무엇인지에 동의 아직 '작은'또는 '큰'- 가수와의 Willet (2003, P.122)
최대 절전 모드

1
세 번째 단락과 관련하여 Jeffreys (1961, p. 432)가 진행 한 증거 강도 범주를 채택하려면 전체 참조를 제공 할 수 있습니다.
동면

답변:


23

AIC와 BIC는 모델 비교 측면에서 동일한 해석을합니다. 즉, AIC 또는 BIC의 차이가 클수록 한 모델에서 다른 모델에 대한 강력한 증거가 나타납니다 (낮을수록 좋습니다). 그것은 단지 AIC가 BIC만큼 강력하게 매개 변수의 수를 처벌하지 않습니다. 더 작은 샘플 크기에 사용되는 AIC (AICc)에 대한 수정도 있습니다. AIC / BIC 비교에 대한 자세한 내용은 여기를 참조하십시오 .


5
+1. 추가 / 명확하게하기 위해 : AIC (및 AICc)는 KL- 분산을 사용합니다. 따라서 AIC가 "추가"정보를 반영할수록 정확하게 작을수록 좋습니다. 즉, 표본 크기 와 같이 최소 AIC 점수를 가진 모델은 가장 작은 Kullback-Leibler 발산을 가지므로 "true"모델에 가장 가까운 모델이됩니다. N
usεr11852는 Reinstate Monic

28

당신은 두 가지 다른 것에 대해 이야기하고 있으며 그것들을 섞고 있습니다. 첫 번째 경우에는 두 가지 모델 (1 및 2)이 있으며 A I C 2 와 같은 AIC를 얻었습니다 . 당신이 자신의 AIC의 근거로이 두 모델을 비교하려는 경우 선호 하나, 즉하면 될 것이다 낮은 AIC와 모델 I C가 1 < I C (2) 다음 픽업 모델 1과 바이스의 경우도 마찬가지입니다. 두 번째 경우에, 당신은 모델 같은 후보 모델의 설정 ( 1 , 2 , . . . , N )AIC1AIC2AIC1<AIC2
(1,2,...,n)각 모델에 대해 AIC 차이를 . 여기서 A I C ii 번째 모델 의 AIC 이고 A I C m i n 은 AIC의 최소값입니다. 모든 모델. 이제 Δ i > 10 인 모델은 지원되지 않으며 모델 선택 및 다중 모델 추론 : 실제 정보 이론적 접근 에서 설명한대로 추가 고려 사항에서 생략 할 수 있습니다 .Δi=AICiAICminAICiiAICminΔi>10Kenneth P. Burnham, David R. Anderson, 71 페이지를 참조하십시오. 따라서 가 클수록 모형이 약해집니다. 여기서 가장 좋은 모델은 Δ iΔ m i n0입니다.ΔiΔiΔmin0.


1
아하! 이것은 "보다 큼"비트를 완전히 정리했습니다. 감사!
Tom Carpenter

7

나는 일반적으로 AIC 또는 BIC를 객관적으로 사용하여 모델에 적합하다는 것을 설명하지 않습니다. 내가 않는 두 개의 예측 모델의 상대적 맞춤을 비교하기 위해이 IC를 사용합니다. "2"또는 "4"의 AIC에 관한 한, 그것은 완전히 맥락 적입니다. "좋은"모델이 어떻게 적합한 지 이해하려면 항상 시뮬레이션을 사용해야합니다. AIC에 대한 이해가 옳습니다. AIC는 모수로부터 긍정적 인 기여를, 우도에서 부정적인 기여를받습니다. 당신이하려는 것은 많은 매개 변수로 모델을로드하지 않고 가능성을 최대화하는 것입니다. 따라서 거품이 터져 버린다는 의견은 AIC에 대한 차단이 상황에 맞지 않다는 것입니다.


모델에서 시뮬레이션을 허용하지 않으면 어떻게됩니까?
통계

6
쯧 쯧! 어떻게 가능합니까? 하나는 세상을 부트 스트랩 할 수 있습니다.
AdamO

그것으로 신의 운 ... 세상을 시뮬레이션 lol
Stat

2
@Stat 모델에서 데이터를 시뮬레이션 할 수없는 상황을 상상할 수 없다고 말할 때 매우 진지합니다. 최소한 훈련 데이터 세트에서 부트 스트랩하면 유효한 시뮬레이션 접근 방식이됩니다.
AdamO

부트 스트랩이 어려운 교차 검증 일 때 또는 간단한 잭 나이 핑이 작동해야합니다. 또한 모델 평균화는 유사한 AIC를 가진 모델의 정보를 조정하는 수단을 제공합니다.
N Brouwer

2

여기에 미니어처별로 모델을 선택하기에 적합한 관련 질문 이 있습니까? . 그것은 학계에서 인식 할 수없는 사람들이 글쓰기에 적절하다고 생각하는 것과 중요하게 언급 할 말에 대한 일반적인 아이디어를 제공합니다.

일반적으로 절대 값이 아니라 가능성이나 AIC 간의 차이입니다. 질문에서 "BIC : 0-2 is weak"라는 중요한 단어 "difference"를 놓쳤습니다. Raftery의 표 6을 확인하십시오.

나 자신은 MAICE (Akaike가 말한대로 최소 AIC 견적)를 찾도록 배웠다. 그래서 무엇? 한 유명한 사람이 알려지지 않은 여성에게 쓴 내용은 다음과 같습니다.

Dear Miss -- 
I have read about sixteen pages of your manuscript ... I suffered exactly the same 
treatment at the hands of my teachers who disliked me for my independence and passed 
over me when they wanted assistants ... keep your manuscript for your sons and
daughters, in order that they may derive consolation from it and not give a damn for
what their teachers tell them or think of them. ... There is too much education
altogether.

선생님들은 "두 AIC가 크게 다른지 테스트"와 같은 제목을 가진 논문에 대해 들어 본 적이 없으며 샘플링 분포 및 기타 속성을 가진 AIC를 통계라고 불렀습니다. AIC는 가능한 경우 자동 방식으로 최소화해야 할 기준이라고 배웠습니다.

그러나 몇 년 전 IrishStat에 의해 여기에 표현 된 또 다른 중요한 문제는 (응답을 찾지 못해 메모리가 잘못 되었기 때문에 사과에서) AIC, BIC 및 기타 기준은 다른 목적으로 도출되었으며 예를 들어, 다른 조건 (가정)에서 서로 다른 목적으로 사용할 수없는 경우가 종종 있습니다. 부적절한 것을 선호 할 수는 없습니다.

내 자료에 따르면 Burnham and Anderson (2002, p.70)은 0-2 내의 델타 (AIC 차이)가 실질적인 지원을한다고 인용했다. 4-7 내의 델타는 상당히 적은 지원과 10보다 큰 델타는 실질적으로 지원하지 않습니다. 또한 필자는 "저자도이 지침이 유용한 조건에 대해서도 논의했다"고 썼습니다. 이 책은 Stat의 답변에서 인용되었습니다.


0

정보 기준과 관련하여 SAS 는 다음과 같이 말합니다.

"Akaike (AIC), Schwarz (SC, BIC) 및 QIC와 같은 정보 기준을 사용하여 경쟁되지 않는 경쟁 모델을 비교할 수 있지만 비교 테스트를 제공하지는 않습니다. 따라서 하나의 모델이 유의한지 여부를 나타낼 수 없습니다. GENMOD, LOGISTIC, GLIMMIX, MIXED 및 기타 절차는 정보 기준을 제공합니다. "

a) Vuong 테스트와 b) 비모수 Clarke 테스트의 두 가지 비교 모델 테스트 절차가 있습니다. 자세한 내용은이 백서 를 참조하십시오.


인용 된 "종이"(즉, 프레젠테이션)에 사용 된 수학적 표기법은 주석없이 이해할 수 없음을 발견했습니다. 특히 대시 선은 무엇을 상징합니까? 함축?
Adam Ryczkowski
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.