step()
단계별 회귀 분석을 위해 R 의 함수가 사용하는 임계 p- 값은 무엇입니까 ? 0.15라고 가정하지만 내 가정이 맞습니까? 임계 p- 값을 어떻게 변경할 수 있습니까?
Description
도움말 페이지 의 일부 ?step
: AIC에서 공식 기반 모델을 선택하십시오.
step()
단계별 회귀 분석을 위해 R 의 함수가 사용하는 임계 p- 값은 무엇입니까 ? 0.15라고 가정하지만 내 가정이 맞습니까? 임계 p- 값을 어떻게 변경할 수 있습니까?
Description
도움말 페이지 의 일부 ?step
: AIC에서 공식 기반 모델을 선택하십시오.
답변:
다른 질문에 대한 의견에서 설명했듯이 step
p- 값 대신 AIC를 사용 하십시오 .
그러나 한 번에 하나의 변수에 대해 AIC 는 p- 값 0.15 (또는보다 정확한 0.1573)를 사용하는 것에 해당합니다.
단일 변수에 따라 다른 두 모델을 비교해보십시오. 모델 (더 작은 모델) 및 M 1 (큰 모델)을 호출 하고 AIC를 각각 AIC 0 및 AIC 1 로 설정하십시오.
AIC 기준을 사용하면 경우 더 큰 모델을 사용합니다 . 이 경우 만약 것 - 2 로그 L 0 - ( - 2 로그 L 1 ) > 2 .
그러나 이것은 우도 비 검정의 통계입니다. 통계가 χ 2 1 의 상위 분위수를 초과하면 Wilks의 정리에서 null을 거부합니다 . 따라서 가설 검정을 사용하여 더 작은 모형과 더 큰 모형 중에서 선택하면 − 2 log L 0 - ( − 2 log L 1 ) > C α 일 때 더 큰 모형을 선택합니다 .
이제 는 χ 2 1 의 84.27 백분위 수에 있습니다. 따라서, 우리는 작은 AIC을 갖는 큰 모델의 p- 값과 추가 기간의 시험 귀무 가설을 기각이 대응 선택하면 1 - 0.843 = 0.157 , 또는 15.7 %를
어떻게 수정합니까?
쉬운. k
매개 변수 step
를 2에서 다른 것으로 변경하십시오 . 대신 10 %를 원하십니까? 그것을 2.7로 만드십시오 :
qchisq(0.10,1,lower.tail=FALSE)
[1] 2.705543
2.5 %를 원하십니까? 설정 k=5
:
qchisq(0.025,1,lower.tail=FALSE)
[1] 5.023886
등등.
그러나 이것이 귀하의 질문을 해결하더라도 귀하의 다른 질문에 대한 Frank Harrell의 답변에주의를 기울이고 여기에서 단계별 회귀와 관련된 다른 질문에 대한 많은 통계학 자의 답변을 검색하는 것이 좋습니다. 일반적으로 단계별 절차를 피하기 위해 지속적으로.
위에서 언급했듯이 step
R 의 기능은 AIC 기준을 기반으로합니다. 그러나 p- 값에 따르면 알파는 입력하고 떠나는 알파를 의미한다고 생각합니다. 할 수있는 일은 stepwise
Paul Rubin이 작성한 기능을 사용하는 것 입니다. 보시다시피, 변경할 수있는 alpha.to.enter 및 alpha.to.leave 인수가 있습니다. 이 기능은 F- 테스트 또는 동등한 t- 테스트를 사용하여 모델을 선택합니다. 또한 인수를 올바르게 정의하면 단계적 회귀뿐만 아니라 앞으로 선택 및 뒤로 제거도 처리 할 수 있습니다.