따라서 변수 선택은 모델 선택의 일부라는 것을 알고 있습니다. 그러나 모델 선택은 정확히 무엇으로 구성됩니까? 다음 이상입니다 :
1) 모형의 분포를 선택하십시오
2) 설명 변수를 선택하십시오.
나는 Burnham & Anderson : AIC vs BIC 기사를 읽고 모델 선택에서 AIC와 BIC에 대해 이야기 하기 때문에 이것을 묻습니다 . 내가 '변수 선택'과 같은 '모델 선택'의 생각이었다 실현이 기사를 읽기 (심판. 코멘트 합니까 BIC 진정한 모델을 찾으려고? )
기사에서 발췌 된 "일반성"수준이 높은 12 개 모델에 대한 발췌문에서 이러한 모델은 KL 정보가 12 개 모델에 대해 표시 될 때 "테이핑 효과"(그림 1)를 보여줍니다.
다른 철학과 목표 모델 ... BIC의 목표는 AIC의 목표 모델보다 더 일반적인 모델 임에도 불구하고, n 이 매우 크지 않으면 BIC가 가장 자주 선택한 모델은 모델 7보다 덜 일반적 입니다. 모델 5 또는 6 일 수 있습니다. 수많은 논문과 논문의 시뮬레이션에서 테이퍼링 효과 컨텍스트 (그림 1)에서 AIC가 BIC보다 우수한 것으로 알려져 있습니다. 이것이 실제 데이터 분석의 맥락이라면 AIC를 사용해야합니다.
어떻게 BIC 수 이제까지 내가 이해하지 못하는 모델 선택에서 AIC보다 더 복잡한 모델을 선택! "모델 선택"이란 무엇이며 BIC는 언제 AIC보다 "일반적인"모델을 선택합니까?
변수 선택에 대해 이야기하고 있다면 BIC는 항상 가장 적은 양의 변수가있는 모델을 선택해야합니다. 맞습니까? BIC 의 항은 항상 AIC 의 2 k 항 보다 추가 된 변수에 불이익을 줍니다. 그러나 " BIC의 목표가 AIC의 목표 모델보다 더 일반적인 모델 "인 경우에는 이것이 합리적이지 않습니까?
편집 :
의 주석에 대한 논의에서 다른 이상 AIC 또는 BIC를 선호 할 이유가 있습니까? 우리는 의견에서 @Michael Chernick과 @ user13273 사이의 작은 토론을 보았습니다.
이 토론을 "특징"선택 또는 "공변량"선택이라고 부르는 것이 더 적절하다고 생각합니다. 저에게 모델 선택은 오류 분포, 링크 함수 형태 및 공변량 형태를 지정하는 것보다 훨씬 광범위합니다. AIC / BIC에 관해 이야기 할 때, 일반적으로 공변량의 선택을 제외하고 모델 구축의 모든 측면이 고정 된 상황에 있습니다. – user13273 8 월 13 일 12시 21:17
모델에 포함시킬 특정 공변량을 결정하는 것은 일반적으로 모델 선택이라는 용어로 진행되며 제목에 모델 선택이 포함 된 많은 책이 모델에 포함시킬 모델 공변량 / 파라미터를 주로 결정합니다. – Michael Chernick 8 월 24 '12시 14:44