[0,1]에 베타 회귀 분석으로 분석하려는 데이터가 있습니다. 물론 0,1 값을 수용하려면 무언가를 수행해야합니다. 모델에 맞게 데이터 수정을 싫어합니다. 또한 나는 0과 1 인플레이션이 좋은 생각이라고 생각하지 않습니다.이 경우 0은 매우 작은 양수 값으로 간주해야한다고 생각하기 때문에 (그러나 나는 어떤 값이 적절한 지 정확하게 말하고 싶지 않습니다. .001 및 .999와 같은 작은 값을 선택하고 베타에 대한 누적 거리를 사용하여 모델에 적합해야하므로 관측 값 y_i에 대한 로그 가능성 LL_iwould
if y_i < .001 LL+=log(cumd_beta(.001))
else if y_i>.999 LL+=log(1.0-cum_beta(.999))
else LL+=log(beta_density(y_i))
이 모델에서 내가 좋아하는 것은 베타 회귀 모델이 유효하면이 모델도 유효하지만 극단적 인 값에 대한 약간의 감도를 제거한다는 것입니다. 그러나 이것은 왜 내가 문헌에서 명백한 언급을 찾지 못하는지 궁금해하는 자연스러운 접근 방법 인 것 같습니다. 내 질문은 데이터를 수정하는 대신 모델을 수정하지 않는 것입니다. 데이터를 수정하면 결과가 바이어스되지만 (원래 모델이 유효하다는 가정에 따라) 극단적 인 값을 비닝하여 모델을 수정하면 결과가 바이어스되지 않습니다.
어쩌면 내가 간과하는 문제가 있습니까?