50 개의 연속 설명 변수를 사용하여 이진 결과를 예측하려고합니다 (대부분의 변수 범위는 ~ ). 내 데이터 세트에는 거의 24,000 개의 행이 있습니다. 내가 실행하면 R에, 내가 얻을 :glm
Warning messages:
1: glm.fit: algorithm did not converge
2: glm.fit: fitted probabilities numerically 0 or 1 occurred
완벽한 분리가 발생할 수 있음을 암시하는 다른 응답을 읽었지만 내 데이터에는 그렇지 않다고 확신합니다. . 일부 변수를 제거하면 "수렴하지 않았습니다"오류가 사라질 수 있습니다. 그러나 항상 그런 것은 아닙니다.
bayesglm
함수 에서 동일한 변수를 사용하려고 시도했지만 동일한 오류가 발생했습니다.
여기서 무슨 일이 일어나고 있는지 정확히 파악하기 위해 어떤 단계를 수행 하시겠습니까? 어떤 변수가 문제를 일으키는 지 어떻게 알 수 있습니까?
bayesglm
이전을 추가하여 분리를 피하려고하지만 24,000 행으로 이전은 아마도 우연히 늪에 빠질 것입니다. 을 prior.scale
가능한 많이 많이 줄이십시오. 또한 사전의 자유도를 높이면 분리와 관련된 큰 가치를 배제하는 데 도움이됩니다.
bayesglm