Galit Shmueli의 "설명하거나 예측하다" (2010) 를 읽은 나는 명백한 모순에 의아해한다. 세 가지 전제가 있습니다
- AIC 대 BIC 기반 모델 선택 (300 페이지의 끝-301 페이지의 시작) : 간단히 말해 AIC는 예측 을위한 모델을 선택하는 데 사용되고 BIC는 설명을 위한 모델을 선택하는 데 사용해야합니다 . 또한 (위의 논문에서는 제외) 일부 조건에서 BIC 가 후보 모델 세트 중에서 실제 모델을 선택한다는 것을 알고 있습니다 . 진정한 모델은 우리가 설명 적 모델링에서 추구하는 것입니다 (p. 293의 끝).
- 간단한 산술 : AIC는 크기가 8 이상인 샘플에 대해 BIC보다 더 큰 모델 을 선택합니다 AIC와 BIC의 복잡도 차이로 인해 만족 ).
- "true"를 모델 (올바른 회귀하고 올바른 함수 형태하지만 불완전 추정 계수 즉, 모델) 예측을위한 최적의 모델이 될 수 없습니다 (P 307.) : 누락 된 예측과 회귀 모델은 더 나은 예측 모델이 될 수 있습니다 -예측 불확실성으로 인한 분산 감소로 인해 누락 된 예측 변수로 인한 편향의 도입이 가중치를 초과 할 수 있습니다.
포인트 1과 2는 더 큰 모델이 더 포용적인 모델보다 예측에 더 좋을 수 있다고 제안합니다. 한편, 포인트 3 은 더 큰 모델보다 예측이 더 나은 모델이 더 나은 반대의 예를 제공합니다 . 나는이 수수께끼를 발견한다.
질문 :
- 점들 사이의 명백한 모순은 어떻게 {1. 그리고 2.}와 3.는 설명 / 해결 되었는가?
- 포인트 3에 비추어, AIC가 선택한 더 큰 모델이 실제로 BIC가 선택한 더 웅장한 모델보다 예측에 더 나은 이유와 방법에 대한 직관적 인 설명을 제공 할 수 있습니까?