하나는 두 개의 AIC 의 절대 값 ( 같지만 )을 비교하지는 않지만 그 차이를 고려합니다 .
여기서 는 의 AIC -번째 모델이며 은 검사 된 모델 세트 (예 : 선호 모델) 중에서 가장 낮은 AIC입니다. 의 예를 들어 설명 엄지 손가락의 규칙, 번햄 & 앤더슨 2004 입니다 :∼100∼1000000
Δi=AICi−AICmin,
AICiiAICmin
- 경우 다음에 대한 실질적인 지원이 번째 모델 (또는 가치 만 베어 언급이다에 대해 증거), 그것은 적절한 설명이라는 명제가 가능성이 매우 높다;Δi<2i
- 만약 다음 강력한 지지체가 번째 모델;2<Δi<4i
- 경우 후 상당히 덜 지지체가 번째 모델;4<Δi<7i
- 모델 은 기본적으로 지원되지 않습니다.Δi>10
이제 질문에 언급 된 0.7 %와 관련하여 다음 두 가지 상황을 고려하십시오.
- AIC1=AICmin=100 이고 는 0.7 % 더 큽니다 : . 그런 다음 이므로 모델간에 큰 차이가 없습니다.AIC2AIC2=100.7Δ2=0.7<2
- AIC1=AICmin=100000 이고 는 0.7 % 더 큽니다 : . 그런 다음 이므로 2 차 모델은 지원되지 않습니다.AIC2AIC2=100700Δ2=700≫10
따라서, AICS의 차이는 0.7 % 제공하지 않는 것을 말하는 어떤 정보를.
AIC 값에는 로그 우도 에서 오는 스케일링 상수가 포함되어
있으므로 에는 이러한 상수가 없습니다. 은 최고의 모델이 을 갖도록하는 크기 조정 변환으로 간주 될 수 있습니다 .LΔiΔi=AICi−AICminAICmin:=0
AIC의 제형은 과도한 수의 파라미터의 사용을 불이익을 주므로 과적 합을 막는다. 다른 모델이 실질적으로 더 잘 맞지 않는 한 더 적은 매개 변수를 가진 모델을 선호합니다. AIC는 (시험중인 데이터의 형태로) 현실을 가장 적절하게 설명하는 모델 (검토 된 모델 중에서)을 선택하려고합니다. 이는 실제로 데이터에 대한 실제 설명 인 모델은 고려되지 않음을 의미합니다. AIC는 어떤 모델 이 데이터를 더 잘 묘사 하는지에 대한 정보를 제공하지만 해석 은하지 않습니다 .
개인적으로 , 만약 당신이 간단한 모델과 훨씬 더 낮은 AIC를 가진 복잡한 모델을 가지고 있다면, 간단한 모델로는 충분하지 않다고 말할 것입니다. 더 복잡한 모델이 훨씬 더 복잡하지만 가 크지 않은 경우 (아마도 , 아마도 특정 상황에 따라 다름) 작업이 더 쉬운 경우 더 간단한 모델을 고수합니다. .ΔiΔi<2Δi<5
또한 다음을 통해 번째 모형에 확률을 부여 할 수 있습니다.i
pi=exp(−Δi2),
번째 모델이 AIC를 최소화 할 수있는 상대 확률 ( 과 비교)을 제공합니다 . 예를 들어, 는 (quite high)에 해당하고 는 (quite low)에 해당합니다. 첫 번째 경우는 번째 모델이 실제로 을 생성 한 모델보다 더 나은 설명 일 가능성이 47 % 이며, 두 번째 경우에는이 확률이 0.05 %임을 의미합니다. i Δ i = 1.5 p i = 0.47 Δ i = 15 p i = 0.0005 i A I C m i nAICminiΔi=1.5pi=0.47Δi=15pi=0.0005iAICmin
마지막으로 AIC 공식에 대해 :
AIC=2k−2L,
이 비슷한 두 모델을 고려할 때 는 항 으로 인한 매개 변수 수에만 의존 한다는 점에 유의해야합니다 . 따라서 인 경우 상대적 개선은 매개 변수의 수만 늘리는 것이 아니라 실제 적합도의 개선 때문입니다.Δ i 2 k Δ iLΔi2kΔi2Δk<1
TL; DR
- 나쁜 이유입니다. AIC의 절대 값 사이의 차이를 사용하십시오.
- 백분율은 아무 것도 말하지 않습니다.
- 모델, 데이터 및 다른 결과의 의미 에 대한 정보가 없기 때문에이 질문에 대답 할 수 없습니다 .