답변:
LL = loglikelihood하자
다음은 summary (glm.fit) 출력에서 확인한 내용입니다.
널 편차 = 2 (LL (포화 모델)-LL (널 모델)) df = df_Sat-df_Null
잔차 편차 = 2 (LL (포화 모델)-LL (제안 모델)) df = df_Sat-df_Proposed
포화 모델은 각 데이터 포인트를 가정 모델이 자신의 매개 변수를 가지고있다 (당신이 추정하는 매개 변수 N을 의미합니다.)
널 모델 만 1 개 매개 변수를 추정 의미 데이터 포인트 모두를위한 하나 개의 매개 변수를 가정 즉에, 정확한 "반대"를 가정합니다.
제안 된 모델 은 P + 1 개 매개 변수가 있도록, P 매개 변수 + 절편 용어로 데이터 포인트를 설명 할 수있는 가정합니다.
귀하의 경우 널 일탈는 정말 작은, 그것은 널 모델은 꽤 잘 데이터를 설명하고 있음을 의미한다. 마찬가지로 잔류 편차도 마찬가지입니다 .
작은 것이 무엇을 의미합니까? 모형이 "양호"이면 편차 는 대략 Chi ^ 2 (df_sat-df_model) 자유도입니다.
널 모델과 제안 된 모델을 비교하려면
(널 편차-잔차 편차) df가 제안 된 대략 Chi ^ 2 -df 널 = (n- (p + 1))-(n-1) = p
R에서 직접 얻은 결과입니까? Null에보고 된 자유도가 항상 Residual에보고 된 자유도보다 높음을 알기 때문에 약간 이상하게 보입니다. 그것은 다시 Null Deviance df = 포화 df-Null df = n-1 잔류 편차 df = 포화 df-제안 된 df = n- (p + 1)이기 때문입니다.
널 이탈은 인터셉트 만있는 모델에서 반응을 얼마나 잘 예측하는지 보여줍니다.
잔차 이탈은 예측 변수가 포함 된 경우 모형에서 반응을 얼마나 잘 예측하는지 보여줍니다. 귀하의 예에서 22 개의 예측 변수가 추가되면 편차가 3443.3 증가 함을 알 수 있습니다 (참고 : 자유도 = 관측치 수 – 예측치 수). 이탈의 증가는 상당한 적합 부족의 증거입니다.
또한 잔차 이탈을 사용하여 귀무 가설이 참인지 여부를 테스트 할 수 있습니다 (즉, 로지스틱 회귀 모델이 데이터에 적합 함을 제공함). 편차는 특정 자유도에서 카이 제곱 값으로 주어지기 때문에 가능합니다. 유의성을 테스트하기 위해 R의 아래 공식을 사용하여 관련 p- 값을 찾을 수 있습니다.
p-value = 1 - pchisq(deviance, degrees of freedom)
위의 잔차 이탈 및 DF 값을 사용하면 귀무 가설을 뒷받침 할 증거가 상당히 부족하다는 것을 보여주는 약 0의 p- 값을 얻게됩니다.
> 1 - pchisq(4589.4, 1099)
[1] 0
GLM
?가 아닌 다항식 모델에 대해 이야기하는 경우 정의가 변경 됩니까?