베타 회귀 (즉, 베타 분포 및 일반적으로 로짓 링크 함수가있는 GLM)는 분수, 비율 또는 확률과 같이 0과 1 사이의 값을 취하는 반응 일명 종속 변수를 처리하는 데 권장됩니다 . 결과에 대한 회귀 (비율 또는 분수) 0과 1 사이 입니다.
그러나 베타 회귀 분석은 응답 변수가 적어도 한 번은 0 또는 1이 되 자마자 사용할 수 없다고 주장합니다. 만약 그렇다면, 0 / 1- 팽창 베타 모델을 사용하거나 응답 등을 일부 변환해야합니다 : 1과 0을 포함한 비례 데이터의 베타 회귀 .
내 질문은 : 베타 배포의 어떤 속성이 베타 회귀가 정확한 0과 1을 처리하지 못하게하고 그 이유는 무엇입니까?
나는 것으로 추측하고 과 베타 분포의 지원하지 않습니다. 그러나 모든 모양 매개 변수 및 , 0과 1 은 모두 베타 분포를 지원합니다. 분포가 한쪽 또는 양쪽에서 무한대로 진행되는 작은 모양 매개 변수에 대해서만 가능합니다. 그리고 아마도 표본 데이터는 최적의 적합을 제공 하는 와 가 모두 보다 높을 것 입니다.
이 경우에 그 뜻 한 수 도 제로 / 사람과 실제로 사용 베타 회귀?
물론 0과 1이 베타 분포를 지원하더라도 정확히 0이나 1을 관찰 할 확률은 0입니다. 그러나 다른 주어진 계산 가능한 값 집합을 관찰 할 가능성이 있으므로 문제가 될 수 있습니까? ( @Glen_b 의이 의견 참조 ).
베타 회귀와 관련하여 베타 분포는 다르게 매개 변수화되지만 경우 모든 μ에 대해 에서 여전히 잘 정의되어야합니다 .