답변:
백분율 대신 $ y를 $ [0,1] $의 비율로합시다. 나는 여기서 문제가 가능한 비선형 성 및 검열이라고 생각한다. 오른쪽에 이차항을 포함시켜보십시오. 동시에 다음 모델을 시험해 볼 수 있습니다.
I. 선형 모델 : $ y $가 정확히 0 또는 1이면 선형 모델은 정상입니다. 다음 4 가지 옵션이 마음에 듭니다.
$ y $가 0 또는 1에 가까우면 $ y = \ beta_0 + \ beta_1 x + u $
로그 모델 $ \ ln y = \ beta_0 + \ beta_1 x + u $는 일부 $ y $ 값이 0에 가까울지라도 모두가 1에 가까울 때 유용합니다. 해석이 변경된다는 점에 유의하십시오.
종속 변수를 $ - \ ln (1-y) $로 변환하십시오. 이것은 $ y $가 모두 0이 아니라 하나에 가까울 때 유용합니다. 그러나 이것은 나에게 부 자연스러운 것처럼 보입니다. 나는 대신 다음 물류 모델을 고려할 것입니다.
물류 모델 $ \ ln \ frac {y} {1-y} = \ beta_0 + \ beta_1 x + u $. 이것은 대개 $ y \ simeq 0 $ 및 $ y \ simeq 1 $가 많은 경우에 유용합니다. 통역은 로짓의 관점에서 수행됩니다.
II. 토빗 모델 : 일부 $ y $가 정확히 0 또는 1이면 Tobit 모델을 사용할 수 있습니다 ( help tobit
Stata에서). 검열 전에 오류 기간에 대해 정상 성이 가정됨을 기억하십시오. 또한 Tobit 모델을 사용하면 "검열되지 않으면 $ y $는 1보다 클 수 있다고 생각합니다. (0보다 작습니다)."