glmer
비즈니스 데이터에 임의 효과 모델을 적용하고 있습니다. 목표는 지역별 변동을 고려하여 총판 별 판매 실적을 분석하는 것입니다. 다음과 같은 변수가 있습니다.
distcode
: 약 800 레벨의 총판 IDregion
: 최상위 지리 ID (북쪽, 남쪽, 동쪽, 서쪽)zone
: 중간 수준 지리 내에region
약 30 개 수준이 중첩되어 있습니다.territory
:zone
약 150 단계 내에 중첩 된 저수준 지리
각 유통 업체는 한 지역에서만 운영됩니다. 까다로운 부분은 배포 자당 하나의 데이터 포인트가있는 요약 된 데이터라는 것입니다. 따라서 800 개의 데이터 포인트가 있으며 규칙적인 방식으로 800 개 매개 변수를 맞추려고합니다.
다음과 같이 모델을 장착했습니다.
glmer(ninv ~ 1 + (1|region/zone/territory) + (1|distcode), family=poisson)
메모를 인쇄하지만 문제없이 실행됩니다.
임의의 효과에 대한 그룹화 요소의 수준 번호는 동일 , 관찰의 수 (n)에
이것은 합리적인 일입니까? 나는 모든 계수의 유한 한 추정치를 얻었고 AIC도 부당하지 않습니다. 아이덴티티 링크로 포아송 GLMM을 시도하면 AIC가 훨씬 나빠 지므로 로그 링크는 적어도 좋은 출발점입니다.
적합 값과 반응을 비교하면 본질적으로 완벽하게 맞는 것을 얻습니다. 배포자 당 하나의 데이터 포인트가 있기 때문입니다. 그것이 합리적입니까, 아니면 완전히 바보 같은 일을하고 있습니까?
한 달 동안 데이터를 사용하고 있습니다. 여러 달 동안 데이터를 가져 와서 그러한 방식으로 복제 할 수 있지만 월간 변동 및 가능한 상호 작용에 대한 새로운 용어를 추가해야합니까?
ETA : 위의 모델을 다시 실행했지만 family
인수는 없었습니다 (따라서 GLMM이 아닌 가우스 LMM). 이제 lmer
다음과 같은 오류가 발생했습니다.
오류 (함수 (fr, FL, start, REML, verbose) : 랜덤 효과에 대한 그룹화 요소의 수준 수는 관측치 수보다 작아야합니다.
그래서 나는 가족을 바꾸는 것이 효과가 없어야하기 때문에 현명한 일을하고 있지 않다고 생각합니다. 그러나 지금 문제는 왜 처음부터 효과가 있 었는가입니다.