포아송 / 로그 선형 모형의 우도 비 검정을 위해 제로 카운트를 조정해야합니까?


9

우연성 표에 0이 glm있고 우도 비율 검정에 중첩 포아송 / 로그 선형 모형 (R의 함수 사용)을 피팅하는 경우 glm 모형을 피팅하기 전에 데이터를 조정해야합니다 (예 : 모두에 1/2 추가) 카운트)? 조정 없이는 일부 파라미터를 추정 할 수 없지만 조정 / 조정 부족이 LR 테스트에 어떤 영향을 줍니까?


아마도 glm0을 처리 할 수 ​​없다면 루틴이 작동하지 않을 것입니다. 당신은 그것을 시도 했습니까?
shabbychef

1
예, 충돌하지는 않지만 공식 (예 : 포화 모델)에 따라 일부 매개 변수는 사실상 무한한 표준 오류를 가질 수 있습니다. 내 질문은 우도 비율 테스트를 수행 할 때 이것이 문제인지 여부입니다. 일부 모수를 추정하지 않더라도 해당 모수는 우도에 영향을 미치지 않습니다. 표준 관행은 무엇이며 왜 그런가요?
BR1

답변:


7

회귀 모델링의 장점 중 하나는 일반적으로 데이터가없는 영역을 매끄럽게 할 수 있다는 것입니다. 알다시피 매개 변수 추정에 문제가있는 경우가 있습니다. 무한 표준 오류와 같은 일이 발생하면 모델링 접근법을 조금씩 다시 생각할 시간입니다.

주의해야 할 한 가지주의 사항 : 특정 지층에서 "횟수 없음"사이에는 차이가 있으며 해당 지층에 계수 가있는 것은 불가능합니다 . 예를 들어, 2000 년과 2009 년 사이에 미 해군의 심리적 장애에 대한 연구를 진행 중이고 "Is a Woman"과 "Subserv on Submarine"에 대한 이진 회귀 항이 있다고 가정합니다. 회귀 모델 모두 = 1 인 0 카운트에도 불구하고 두 변수 = 1 인 효과를 추정 할 있습니다. 그러나 추론이 유효하지 않을 수 있습니다. 이 문제를 "비 양성"이라고하며 고도로 계층화 된 모델에서 문제가되는 경우가 있습니다.


@ skyguy94 이상하게도 충분하지 않습니다-나는 회고 적 데이터 세트의 사용을 잊어 버렸다는 것을 알았습니다.>. <. 그것을 반영하기 위해 편집했습니다.
Fomite

Re : "회귀 모델은 두 변수가 모두 1 인 효과 또는 두 변수 사이의 상호 작용 을 추정 할 수 있습니다. "-나는 그것이 사실이라고 생각하지 않습니다. 절대 '1'이 아닌 2 개의 이진 예측 변수가있는 경우 교호 작용은 일정하므로 (항상 '0'임) 결과가 식별되지 않습니다.
매크로

@ 매크로 당신 말이 맞아요, 약간 편집하고 있습니다. 이진 표시기가 아닌 용어를 생각하고있었습니다.
Fomite

1
(+1) 그래서 따로 둘 다 = 1, 모델 기반의 추정은 단지 우리가 아주 그 자체가 :) 년대에 오해의 소지가 될 수있어 두 한계 효과의 합이 될 경우의 비 타당성 문제
매크로
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.