마이너스 무한대에서 플러스 무한대까지의 변수를 만들기 위해 로짓 변환을 수행하지 않습니까? 0과 1을 가진 데이터에 문제가 있는지 확실하지 않습니다. 오류 메시지가 표시됩니까? 그건 그렇고, 당신이 비율을 가지고 있다면 분석은 항상 잘못 나올 것입니다. 여러 사례와 함께 사용해야 weight=argument
합니다 glm
.
아무 것도 효과가 없다면, 중간 분할 또는 사 분위 분할 또는 DV를 여러 범주로 분할하고 대신 순서 형 로지스틱 회귀를 실행하기에 적절하다고 생각되는 컷 포인트를 사용할 수 있습니다. 작동 할 수 있습니다. 이것들을보십시오.
개인적으로 0에 0.001을 추가하고 0에서 0.001을 얻는 것이 너무 나쁜 생각이라고 생각하지는 않지만 나중에 논의 할 몇 가지 문제가 있습니다. 그냥 0.000000001 (또는 더 많은 소수)을 더하고 빼지 않는 이유는 무엇입니까? 그것은 0과 1을 더 잘 표현할 것입니다! 별 차이가없는 것 같습니다. 그러나 실제로 그렇습니다.
다음을 보자.
> #odds when 0 is replaced by 0.00000001
> 0.00000001/(1-0.00000001)
[1] 1e-08
> log(0.00000001/(1-0.00000001))
[1] -18.42068
> #odds when 1 is replaced by (1-0.00000001):
> (1-0.00000001)/(1-(1-0.00000001))
[1] 1e+08
> log((1-0.00000001)/(1-(1-0.00000001)))
[1] 18.42068
> #odds when 0 is replaced by 0.001
> 0.001/(1-0.001)
[1] 0.001001001
> log(0.001/(1-0.001))
[1] -6.906755
> #odds when 1 is replaced by (1-0.001):
> (1-0.001)/(1-(1-0.001))
[1] 999
> log((1-0.001)/(1-(1-0.001)))
[1] 6.906755
따라서 확률을 (0/1) 및 (1/0)에 가깝게 유지해야합니다. 마이너스 무한대에서 플러스 무한대까지의 로그 확률이 예상됩니다. 따라서 더하거나 빼려면 로그 확률이 무한대에 가까워 지도록 정말로 긴 소수점 이하 자리까지 선택해야합니다! 충분히 크게 고려할 수있는 정도는 전적으로 귀하에게 달려 있습니다.