AIC 및 Schwarz 기준 이해


13

물류 모델을 실행 중입니다. 실제 모델 데이터 세트에는 100 개 이상의 변수가 있지만 약 25 개의 변수가있는 테스트 데이터 세트를 선택하고 있습니다. 그 전에 8-9 변수가있는 데이터 세트를 만들었습니다. AIC 및 SC 값을 사용하여 모델을 비교할 수 있다고 들었습니다. 변수의 p 값이 낮더라도 (예 : 0053) 모델의 SC 값이 더 높다는 것을 관찰했습니다. 내 직감에 따라 유의 수준이 좋은 변수가있는 모델은 SC 및 AIC 값이 낮아야합니다. 그러나 그것은 일어나지 않습니다. 누군가가 이것을 명확히 할 수 있습니까? 요컨대 나는 다음과 같은 질문을하고 싶다 :

  1. 변수의 수는 SC AIC와 관련이 있습니까?
  2. p 값 또는 낮은 SC AIC 값에 집중해야합니까?
  3. SC AIC 값을 줄이는 일반적인 방법은 무엇입니까?

답변:


15

정확한 방식으로 질문에 대답하는 것은 매우 어렵지만 동일한 정보를 제공하지 않는 두 가지 기준 (정보 기준 및 p- 값)을 비교하는 것 같습니다. 모든 정보 기준 (AIC 또는 Schwarz 기준)에서 모형의 적합도가 적을수록 (통계적 관점에서) 모형의 적합 부족과 모형의 매개 변수 수 간의 균형을 반영하므로 모형의 적합도가 더 좋습니다 ; 예를 들어 Akaike 기준은 읽습니다.2log()+2kkp

과도한 문제를 피하기 위해 변수 선택을 수행 할 수 있는 불완전 회귀 분석을 제안 합니다. 이것은 Frank Harrell의 회귀 모델링 전략 (p. 207 ff.) 또는 Moons et al., Penalized Maximum Likelihood Estimation에 대한 과대 낙관론에 대한 진단 및 예후 예측 모델을 직접 조정하기위한 Penalized Maximum Likelihood Estimation : 임상 예 , J Clin Epid (2004) 57 ( 12).

또한, 참조 디자인 ( lrm)와 stepPlr ( step.plr) R 패키지, 또는 패키지를. 이 SE 에서 변수 선택 에 대한 관련 질문을 찾아 볼 수 있습니다 .


안녕 chl, 답장을 보내 주셔서 감사합니다. 나는 당신의 답변에서 정보를 얻었음을 인정합니다. (1) 표본 크기가 크면 P 값이 떨어질 수 있다는 힌트를 얻습니다. 내 이해에 따르면 p 값은 귀무 가설이 기각되는지 여부 만 보여줄 수 있습니다. (2) 이제 절편 만 있고 공변량으로 AIC 값의 차이를 볼 필요가 있음을 이해합니다. 더 낮은 AIC를 원한다고 말할 때 동일한 데이터 세트를 의미한다고 가정합니다. 댓글에 문자가 남았습니다. 답장하면 다시 댓글을 달
겠습니다

1
@ayush (1) 테스트 통계 (예 : Wald)는 샘플 크기에 따라 다릅니다 (샘플 크기가 증가함에 따라 표준 오류가 감소하며 샘플이 클수록 p- 값이 낮아질 수 있음). (2) 예, AIC는 중첩되지 않은 모델을 비교하는 데 사용될 수 있지만 여기서는 복잡성을 증가시키는 다양한 모델을 비교하는 방법으로 생각했습니다.
chl

다시 한 번 감사드립니다. 나는 지금 p 가치의 본질을 얻는다. 약 5 분 전 나는 모든 변수에 대해 p 값이 .05 미만인 p 값을 제공하는 모델을 실행했지만 28238.407의 AIC는 절편 만 있고 공변량은 21507.933입니다. 또한 AIC가 절편 만 있고 공변량 4234.xy를 가진 16035.xy 인 경우도 있습니다. 두 경우를 비교하여 당신의 의견은 무엇입니까? 두 번째 모델은 25 var 동안 변수는 다르지만 첫 번째는 20 변수입니다. 따라서 두 번째 모델은 변수가 많지만 (25와 20 비교) AIC가 낮았습니다. p 값은 모두 0.05가 아니었다. .. 이후에 문의하시기 바랍니다 .. 감사합니다.
ayush biyani

@ayush 변수가 어떻게 선택되었는지 모른 채 모델 품질에 대해 대답하기는 어렵습니다. 절편 만 포함하고 일부 공변량을 포함하는 모형 간 AIC의 간격은 예측 변수의 "설명력"에 대한 표시를 제공합니다 (두 번째 사례에서 잔차 편차가 크게 감소한 것으로 보이며 AIC는 내 응답에서 말한 # 매개 변수). 이러한 예측 변수의 관련성에 대한 완전한 답변은 아닙니다. 특정 연구를위한 GLM의 변수 선택 과 같은보다 구체적인 질문 (IMO)을 요청하는 것이 좋습니다 .
chl

8

SC와 AIC를 함께 그룹화하는 것은 잘못되었습니다 입니다. 사람들이 많이 잘못 사용하더라도 그것들은 매우 다릅니다. AIC는 상황을 예측할 때 의미가 있습니다.이 시나리오에서 SC를 사용하면 (항상 그런 것은 아님) 잘못된 결과를 초래할 수 있습니다. 마찬가지로 parsimony (Occam 's Razor) SC의 원칙으로 모델 선택에 관심이 있다면 더 좋습니다. 이론적 인 세부 사항을 다루고 싶지는 않지만 간단히 말해서 SC : 데이터를 설명하는 가장 간단한 모델과 동등한 것을 원할 때 parsimonious 모델에 적합합니다 .AIC-예측하고 싶을 때. AIC는 실제 모델이 SC와 같은 모델 공간에 있다고 가정하지 않습니다.

둘째, phl 값과 정보 기준을 함께 사용하는 것도 chl에 설명 된대로 오도 될 수 있습니다 .

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.