R의 단계적 회귀 – 임계 p- 값


12

step()단계별 회귀 분석을 위해 R 의 함수가 사용하는 임계 p- 값은 무엇입니까 ? 0.15라고 가정하지만 내 가정이 맞습니까? 임계 p- 값을 어떻게 변경할 수 있습니까?


7
R의 '단계'기능은 AIC 기반입니다.
Michael M

7
단계적 모델 선택 루틴을 전혀 사용하지 않는 것이 가장 좋습니다. 이유를 이해하려면 여기에서 내 대답을 읽는 데 도움이 될 수 있습니다 . 자동 모델 선택 알고리즘 .
gung-모니 티 복원

3
@MichaelMayer의 의견 : Description도움말 페이지 의 일부 ?step: AIC에서 공식 기반 모델을 선택하십시오.
Stephan Kolassa

답변:


27

다른 질문에 대한 의견에서 설명했듯이 stepp- 값 대신 AIC를 사용 하십시오 .

그러나 한 번에 하나의 변수에 대해 AIC p- 값 0.15 (또는보다 정확한 0.1573)를 사용하는 것에 해당합니다.

단일 변수에 따라 다른 두 모델을 비교해보십시오. 모델 (더 작은 모델) 및 M 1 (큰 모델)을 호출 하고 AIC를 각각 AIC 0AIC 1 로 설정하십시오.M0M1AIC0AIC1

AIC 기준을 사용하면 경우 더 큰 모델을 사용합니다 . 이 경우 만약 것 - 2 로그 L 0 - ( - 2 로그 L 1 ) > 2 .AIC1<AIC02logL0(2logL1)>2

그러나 이것은 우도 비 검정의 통계입니다. 통계가 χ 2 1 의 상위 분위수를 초과하면 Wilks의 정리에서 null을 거부합니다 . 따라서 가설 검정을 사용하여 더 작은 모형과 더 큰 모형 중에서 선택하면 2 log L 0 - ( 2 log L 1 ) > C α 때 더 큰 모형을 선택합니다 .αχ122logL0(2logL1)>Cα

이제 χ 2 1 의 84.27 백분위 수에 있습니다. 따라서, 우리는 작은 AIC을 갖는 큰 모델의 p- 값과 추가 기간의 시험 귀무 가설을 기각이 대응 선택하면 1 - 0.843 = 0.157 , 또는 15.7 %를2χ1210.843=0.15715.7%


어떻게 수정합니까?

쉬운. k매개 변수 step를 2에서 다른 것으로 변경하십시오 . 대신 10 %를 원하십니까? 그것을 2.7로 만드십시오 :

qchisq(0.10,1,lower.tail=FALSE)
[1] 2.705543

2.5 %를 원하십니까? 설정 k=5:

qchisq(0.025,1,lower.tail=FALSE)
[1] 5.023886

등등.


그러나 이것이 귀하의 질문을 해결하더라도 귀하의 다른 질문에 대한 Frank Harrell의 답변에주의를 기울이고 여기에서 단계별 회귀와 관련된 다른 질문에 대한 많은 통계학 자의 답변을 검색하는 것이 좋습니다. 일반적으로 단계별 절차를 피하기 위해 지속적으로.


좋은 설명입니다. 이것이 일반 회귀 t- 검정의 p- 값에 대략적으로 해당되는지 여부를 알고 있습니까?
Ben Ogorek

α=0.05

(ctd) ... 단계적으로 심각한 문제가 많이 있습니다. 다른 것에는 치우친 추정치와 너무 작은 표준 오차가 포함됩니다.
Glen_b-복지 주 모니카

1
단계적 모델 선택에 문제를 제쳐두고 작은 AIC => .1573 p- 값 규칙을 일반화하는 데 관심이 있습니다. 설명하는 우도 비율 p- 값은 양호하지만 R의 lm과 같은 루틴에서는 추정 /std.err가 t- 분포와 비교됩니다. 이것은 다른 테스트이며 귀하의 .1573 결과가 약을 유지할지 궁금합니다.
Ben Ogorek

2
tk

4

위에서 언급했듯이 stepR 의 기능은 AIC 기준을 기반으로합니다. 그러나 p- 값에 따르면 알파는 입력하고 떠나는 알파를 의미한다고 생각합니다. 할 수있는 일은 stepwisePaul Rubin이 작성한 기능을 사용하는 입니다. 보시다시피, 변경할 수있는 alpha.to.enter 및 alpha.to.leave 인수가 있습니다. 이 기능은 F- 테스트 또는 동등한 t- 테스트를 사용하여 모델을 선택합니다. 또한 인수를 올바르게 정의하면 단계적 회귀뿐만 아니라 앞으로 선택 및 뒤로 제거도 처리 할 수 ​​있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.