50 개의 연속 설명 변수를 사용하여 이진 결과를 예측하려고합니다 (대부분의 변수 범위는 ~ ). 내 데이터 세트에는 거의 24,000 개의 행이 있습니다. 내가 실행하면 R에, 내가 얻을 :glm
Warning messages:
1: glm.fit: algorithm did not converge
2: glm.fit: fitted probabilities numerically 0 or 1 occurred
완벽한 분리가 발생할 수 있음을 암시하는 다른 응답을 읽었지만 내 데이터에는 그렇지 않다고 확신합니다. . 일부 변수를 제거하면 "수렴하지 않았습니다"오류가 사라질 수 있습니다. 그러나 항상 그런 것은 아닙니다.
bayesglm함수 에서 동일한 변수를 사용하려고 시도했지만 동일한 오류가 발생했습니다.
여기서 무슨 일이 일어나고 있는지 정확히 파악하기 위해 어떤 단계를 수행 하시겠습니까? 어떤 변수가 문제를 일으키는 지 어떻게 알 수 있습니까?
bayesglm이전을 추가하여 분리를 피하려고하지만 24,000 행으로 이전은 아마도 우연히 늪에 빠질 것입니다. 을 prior.scale가능한 많이 많이 줄이십시오. 또한 사전의 자유도를 높이면 분리와 관련된 큰 가치를 배제하는 데 도움이됩니다.
bayesglm