모형에서 항을 제거한 후 적절한 잔차 자유도


27

저는 이 질문 에 대한 토론 과 특히 축소 된 모형 (예 : 여러 설명 변수가 테스트되고 거부 된 모형)의 분산 추정치는 Ye의 일반화 된 자유도를 사용해야한다는 Frank Harrell의 의견을 반영하고 있습니다 . Harrell 교수는 이것이 최종 모델 (여러 변수가 기각 된)의 모델보다 원래의 "풀"모델 (모든 변수가 포함 된)의 잔류 자유도에 훨씬 더 근접 할 것이라고 지적했다.

질문 1. 축소 된 모델의 모든 표준 요약 및 통계에 대한 적절한 접근 방법을 사용하려면 (그러나 일반화 된 자유도의 전체 구현이 부족함) 합리적인 자유 접근 방법은 잔차 분산 추정치의 전체 모형 등?

질문 2. 위의 내용이 사실이고에서하려는 경우 R설정만큼 간단 할 수 있습니다.

finalModel$df.residual <- fullModel$df.residual

모델 피팅 실습의 어느 시점에서 finalModel과 fullModel은 lm () 또는 유사한 함수로 작성되었습니다. 그 후 어떤 사람이 finalModel 객체와 분명히 관련이 있다는 오류 메시지를 반환하지만 summary () 및 confint ()와 같은 함수는 원하는 df.residual에서 작동하는 것처럼 보입니다.


8
좋은 질문. Douglas Bates가 p- 값을 lmer출력에 포함하지 않는 이유와 관련이 있습니다. 여기에서 그의 추론을 보십시오 .

2
그런 상황에서 전체 모델 df가 두 번 이상 사용되었습니다. (예 : 접근 방식은 다양한 상황에서 많이 나타납니다. 그것은 사람들에게 정기적으로 추천하는 논문입니다. 많은 기능이 활용할 수있는 일반적이지만 효율적인 R 기능을 갖는 것이 좋을 것입니다.)
Glen_b -Reinstate Monica

답변:


3

어쨌든 parsimony가 추악한 과학적 트레이드 오프와 함께 제공된다는 @FrankHarrel의 대답에 동의하지 않습니까?

나는 Doug Bates의 이론적 근거에 대한 @MikeWiezbicki의 의견제공된 링크를 좋아 합니다 . 누군가 귀하의 분석에 동의하지 않으면 분석을 진행할 수 있으며, 이는 귀하의 기본 가정에 대한 과학적 토론을 시작하는 재미있는 방법입니다. p- 값은 결론을 "절대 진실"로 만들지 않습니다.

모델에 매개 변수를 포함할지 여부를 결정하는 것이 과학적으로 의미있는 샘플의 경우 df의 상대적으로 작은 불일치에 대해 "모발 선택"으로 귀결되는 경우 정당한 문제를 처리하지 않습니다. 어쨌든 더 미묘한 추론-그런 다음 컷오프를 달성하기에 너무 가까운 매개 변수가있어 투명하고 그것에 대해 이야기해야합니다 : 포함하거나 모델을 포함하거나 포함하지 않고 모델을 분석하지만 명확하게 결정에 대해 논의하십시오. 최종 분석. n<p


2
+1 그리고 저는 이제 다른 문제를 고려할 때 실제로 나의 원래 질문이 그렇게 중요하지 않다는 것에 동의하는 경향이 있습니다
Peter Ellis
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.