모형 선택에서 AIC와 p- 값의 동등성


9

질문 에 대한 답변 에서 모델 선택에 AIC를 사용하는 것은 p- 값 0.154를 사용하는 것과 동일하다고 언급되었습니다.

R에서 시도했습니다. 여기서 "뒤로"하위 세트 선택 알고리즘을 사용하여 전체 사양에서 변수를 제거했습니다. 먼저, p- 값이 가장 높은 변수를 순차적으로 버리고 모든 p- 값이 0.154 미만이면 중지하고, 두 번째로, 개선 할 수 없을 때까지 제거 할 때 AIC가 가장 낮은 변수를 제거합니다.

0.154의 p- 값을 임계 값으로 사용할 때 거의 동일한 결과를 제공합니다.

이것이 사실입니까? 그렇다면 왜 그 이유를 알고 있거나 설명 할 수있는 출처를 참조 할 수 있습니까?

추신. 나는 방금 가입했기 때문에 그 사람에게 의견을 말하거나 의견을 쓸 수 없었습니다. 나는 이것이 모델 선택 및 추론 등에 가장 적합한 접근법이 아니라는 것을 알고 있습니다.


(1) 로지스틱 회귀 분석을 통한 예후 모델링 : 소규모 데이터 세트의 선택 및 추정 방법 비교. 의학 통계, 19, 1059-1079 (2) aic 정의를 기반으로 df1 변수에 적용됩니다. 그러나 변수의 자유도가 높을 경우 더 낮을 수 있습니다
Charles Charles

답변:


13

통계 테스트 또는 AIC를 사용하여 수행 한 변수 선택은 매우 문제가됩니다. 사용하는 경우χ2 테스트에서 AIC는 χ2= 2.0에 해당 α=0.157. 개별 변수에 사용될 때 AIC는 새로운 것이 아닙니다. 그것은 더 합리적인 사용α0.05보다 큽니다. 보다 합리적 (추론 방해가 적음)α 0.5입니다.


+1 나는 (지금 삭제 된) 답변을 구성하는 데 너무 오래 보냈지 만 그 동안이 답변을 게시하지조차 못했습니다. 나는 이것을 대신 투표했을 것입니다.
Glen_b-복지 주 모니카
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.