사람들은 모든 종류의 함수를 사용하여 데이터를 0과 1 사이로 유지합니다. 모델을 도출 할 때 로그 홀수는 수학에서 자연스럽게 떨어집니다 ( "표준 링크 함수"라고 함). 다른 대안들.
매크로가 귀하의 질문에 대한 그의 의견에서 언급했듯이, 하나의 일반적인 선택은 로지스틱 함수 대신 가우시안의 양자 함수를 사용 하는 프로 빗 모델 입니다. 나는 시도하지 않았지만 Student 분포 의 Quantile 함수를 사용하는 것에 대해 좋은 소식을 들었 습니다.티
그것들은 모두 같은 기본 S 자형을 갖지만, 각 끝에서 얼마나 빨리 포화되는지에 따라 다릅니다. 프로 비트 모델은 0과 1에 매우 빠르게 접근하므로 확률이 덜 극단적 인 경우 위험 할 수 있습니다. 기반 모델은 t 분포 의 자유도에 따라 어느 쪽이든 갈 수 있습니다 . Andrew Gelman 은 (대부분 관련이없는 상황에서) t 7 은 로지스틱 곡선과 거의 같다고 말합니다 . 자유도를 낮추면 회귀에서 더 두꺼운 꼬리와 더 넓은 범위의 중간 값이 제공됩니다. 자유도가 무한대로되면 프로 빗 모델로 돌아갑니다.티티티7
도움이 되었기를 바랍니다.
추가 편집 : @Macro와 관련된 토론 은 정말 훌륭합니다. 더 자세히 알고 싶으시면 읽어 보시기 바랍니다.