내가 선택한 배포판의 유효성을 검사한다고 말하기에는 너무 멀었습니까?
그것은 정확히 '유효하다'라는 말의 의미에 달려 있지만, 실제로 "널은 사실로 표시됩니다"라고 말할 수없는 것과 같은 방식으로 '예, 너무 멀어집니다'라고 말하고 싶습니다 (특히 포인트 널이 있지만 적어도 어떤 의미에서는 더 일반적으로). 당신은 정말로 "잘, 우리는 그것이 틀렸다는 강력한 증거를 가지고 있지 않습니다"라고 말할 수 있습니다. 그러나 어떤 경우에 우리는 우리의 모델은 완벽하게, 그들이있는 거 기대하지 않는 모델 . Box & Draper가 말한 것처럼 중요한 것은 " 유용하지 않아야하는 것은 얼마나 잘못입니까? "입니다.
다음 두 문장 중 하나입니다.
이것은 가우시안 분포의 선택이 상당히 합리적이라고 제안합니다. 또는 적어도 잔차가 모형에 사용 된 분포와 일치해야합니다.
로그 링크가있는 가우시안 모델이 옳은 것이 아니라 데이터가 합리적이거나 일관성이 있다는 진단이 나타내는 내용을 훨씬 더 정확하게 설명 합니다.
응답 변수가 항상 양수이기 때문에 로그 링크 함수를 선택했지만 좋은 선택인지 확인하고 싶습니다.
그것이 양수 여야한다는 것을 알고 있다면 그 평균은 양수 여야합니다. 적어도 그와 일치하는 모델을 선택하는 것이 합리적입니다. 그것이 좋은 선택 인지 잘 모르겠지만 (더 나은 선택이있을 수도 있지만) 합리적인 방법입니다. 내 출발점이 될 수 있습니다. [하지만 변수 자체가 반드시 양수이면 내 첫 번째 생각은 가우스보다는 로그 링크가있는 감마 인 경향이 있습니다. "필수적으로 긍정적"은 평균에 따라 변하는 왜도 및 분산을 나타냅니다.]
Q2 : 분포 선택에 대한 잔차 검사와 같은 링크 기능 선택을 지원할 수있는 테스트가 있습니까?
'공식 가설 검정'에서와 같이 '테스트'를 의미하는 것이 아니라 '진단 점검'과 같이 들립니다.
두 경우 모두 대답은 그렇습니다.
공식적인 가설 테스트는 Pregibon의 Goodness of link 테스트입니다 [1].
이것은 Box-Cox 매개 변수의 가설 테스트를 수행하기 위해 Box-Cox 제품군에 링크 기능을 포함하는 것을 기반으로합니다.
Breslow (1996) [2]에서 Pregibon의 시험에 대한 간략한 설명을 참조하십시오 ( 14 페이지 참조 ).
η= g( μ )엑스
아르 자형여나는= ( y나는− μ^나는) ( ∂η∂μ)
(이 평가를 위해 기댈 것임) 또는 각 예측 변수에 대해 하나의 플롯을 사용하여 부분 잔차의 선형성 편차를 살펴볼 수 있습니다 (예 : Hardin and Hilbe, 일반화 선형 모형 및 확장, 2 차 에디션 4.5 참조). .4 p54, 정의의 경우)
아르 자형티케이 난= ( y나는− μ^나는) ( ∂η∂μ) + x나는 kβ^케이
= r여나는+ x나는 kβ^케이
데이터가 링크 함수에 의해 변환을 허용하는 경우 선형 회귀와 동일한 방식으로 선형성을 찾을 수 있습니다 (내가 비뚤어 짐 및이 분산 가능성을 가지고 있음에도 불구하고).
범주 형 예측 변수의 경우 링크 기능의 선택이 편의성 또는 해석 가능성의 문제이므로 적합도는 같아야합니다 (따라서 평가할 필요가 없음).
Pregibon의 접근 방식을 기반으로 진단을 내릴 수도 있습니다.
이것들은 철저한 목록을 형성하지 않습니다. 논의 된 다른 진단을 찾을 수 있습니다.
[저는 링크 기능의 선택이 가능하다면 이론적 인 고려 사항에 기초해야한다는 gung의 평가에 동의합니다.]
이 게시물 의 토론 중 일부를 참조하십시오 .
[1] : Pregibon, D. (1980),
"일반 선형 모형에 대한 링크 테스트의 우수성"
, 왕립 통계 학회지. 시리즈 C (응용 통계) ,
Vol. 29, No. 1, 15-23 쪽.
[2] : Breslow NE (1996),
"일반화 된 선형 모델 : 가정 확인 및 결론 강화",
Statistica Applicata 8 , 23-41.
pdf