GLM R의 잔차 및 널 편차 해석


47

R에서 GLM의 Null 및 Residual Deviance를 해석하는 방법은 무엇입니까? 마찬가지로 AIC가 작을수록 좋습니다. 이탈에 대한 유사하고 빠른 해석이 있습니까?

Null 이탈 : 1077 자유도에서 1146.1 잔류 이탈 : 1099 자유도에서 4589.4 AIC : 11089

답변:


74

LL = loglikelihood하자

다음은 summary (glm.fit) 출력에서 ​​확인한 내용입니다.

널 편차 = 2 (LL (포화 모델)-LL (널 모델)) df = df_Sat-df_Null

잔차 편차 = 2 (LL (포화 모델)-LL (제안 모델)) df = df_Sat-df_Proposed

포화 모델은 각 데이터 포인트를 가정 모델이 자신의 매개 변수를 가지고있다 (당신이 추정하는 매개 변수 N을 의미합니다.)

널 모델 만 1 개 매개 변수를 추정 의미 데이터 포인트 모두를위한 하나 개의 매개 변수를 가정 즉에, 정확한 "반대"를 가정합니다.

제안 된 모델 은 P + 1 개 매개 변수가 있도록, P 매개 변수 + 절편 용어로 데이터 포인트를 설명 할 수있는 가정합니다.

귀하의 경우 널 일탈는 정말 작은, 그것은 널 모델은 꽤 잘 데이터를 설명하고 있음을 의미한다. 마찬가지로 잔류 편차도 마찬가지입니다 .

작은 것이 무엇을 의미합니까? 모형이 "양호"이면 편차 는 대략 Chi ^ 2 (df_sat-df_model) 자유도입니다.

널 모델과 제안 된 모델을 비교하려면

(널 편차-잔차 편차) df가 제안 된 대략 Chi ^ 2 -df 널 = (n- (p + 1))-(n-1) = p

R에서 직접 얻은 결과입니까? Null에보고 된 자유도가 항상 Residual에보고 된 자유도보다 높음을 알기 때문에 약간 이상하게 보입니다. 그것은 다시 Null Deviance df = 포화 df-Null df = n-1 잔류 편차 df = 포화 df-제안 된 df = n- (p + 1)이기 때문입니다.


예, 매우 유용한 글쓰기 @TeresaStat입니다. 감사합니다. 이것이 얼마나 강력합니까? GLM?가 아닌 다항식 모델에 대해 이야기하는 경우 정의가 변경 됩니까?
Hack-R

@Teresa : 예,이 결과는 R에서 나왔습니다. 왜 이런 일이 발생합니까? 여기 모델에 문제가 있습니까?
Anjali

@ Hack-R : 늦게 응답해서 죄송합니다 .Stexexchange를 처음 사용했습니다. 다항식 모델의 경우 R에서 glm 함수를 사용하지 않으며 출력이 다릅니다. 비례 승산 모델 또는 순서 회귀 분석 인 mlogit 함수를 살펴 봐야합니다. 다항식 glm에 대해 약간의 독서를하는 것이 가치가 있으며, 약간 다른 가정이 있습니다. 휴식 시간에 접근 할 수 있으면 몇 가지 추가 정보로 업데이트하겠습니다.
TeresaStat

@ Anjali, R에서 왜 그런 결과를 얻을지 잘 모르겠습니다. 데이터 / 결과를 보지 않으면 알기가 어렵습니다. 일반적으로 잔차 자유도가 null df보다 높은 이유는 알 수 없습니다. 몇 개의 매개 변수를 추정 했습니까?
TeresaStat

1
@ user4050 일반적으로 모델링의 목표는 가장 적은 수의 매개 변수를 사용하여 응답에 대해 가장 잘 설명하는 것으로 볼 수 있습니다. 사용할 매개 변수 수를 확인하려면 하나 이상의 매개 변수 추가의 이점을 살펴 봐야합니다. 추가 매개 변수가 더 작은 모델에서 많은 것을 설명하면 (높은 이탈도 생성) 추가 매개 변수가 필요합니다. 얼마를 계량화하려면 통계 이론이 필요합니다. 이론은 이탈이 두 모델 간의 매개 변수 차이와 동일한 자유 도로 카이 제곱된다고합니다. 더 명확합니까?
TeresaStat

13

널 이탈은 인터셉트 만있는 모델에서 반응을 얼마나 잘 예측하는지 보여줍니다.

잔차 이탈은 예측 변수가 포함 된 경우 모형에서 반응을 얼마나 잘 예측하는지 보여줍니다. 귀하의 예에서 22 개의 예측 변수가 추가되면 편차가 3443.3 증가 함을 알 수 있습니다 (참고 : 자유도 = 관측치 수 – 예측치 수). 이탈의 증가는 상당한 적합 부족의 증거입니다.

또한 잔차 이탈을 사용하여 귀무 가설이 참인지 여부를 테스트 할 수 있습니다 (즉, 로지스틱 회귀 모델이 데이터에 적합 함을 제공함). 편차는 특정 자유도에서 카이 제곱 값으로 주어지기 때문에 가능합니다. 유의성을 테스트하기 위해 R의 아래 공식을 사용하여 관련 p- 값을 찾을 수 있습니다.

p-value = 1 - pchisq(deviance, degrees of freedom)

위의 잔차 이탈 및 DF 값을 사용하면 귀무 가설을 뒷받침 할 증거가 상당히 부족하다는 것을 보여주는 약 0의 p- 값을 얻게됩니다.

> 1 - pchisq(4589.4, 1099)
[1] 0

2
이탈과 예측 변수의 수 (pchisq 제외)를 기반으로 적합 / 불량에 대한 컷오프가 무엇인지 어떻게 알 수 있습니까? 잔류 편차> NULL 편차 인 경우 또는 범위 / 비율이 있습니까?
Hack-R

3
당신의 대답은 틀리지 않지만 오해의 대상이됩니다. 실제로, 그것은 오해되었습니다 ( 여기 참조 ). 이를 고려하여 코드에 내재 된 차이점을 명확하게 설명 할 수 있습니까?
gung-복직 모니카
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.