당신은 전혀 로지스틱 회귀를 원하지 않는 것 같습니다. "참 긍정과 거짓 긍정의 차이를 극대화하고 싶습니다." 그것은 객관적인 함수이지만 로지스틱 회귀는 아닙니다. 그것이 무엇인지 보자.
먼저, 약간의 표기법. 종속 변수는 :Yi
Yi={1Purchase i was profitable0Purchase i was un-profitable
독립 변수 (구입 여부를 예측하는 데 사용하는 물건)는 (벡터)가됩니다. 추정하려는 매개 변수는 (벡터)입니다. 때 구매를 예측 합니다. 관찰 경우 또는 표시기 함수 때 구매를 예측 합니다.XiβXiβ>0iXiβ>01Xiβ>0=1
진정한 포지티브 관찰 발생 모두 때 및 . 및 일 때 관측치 에 대한 오 탐지가 발생합니다 . 당신은 발견 할 진정한 양성 마이너스 오탐 (false positive) 또는을 극대화 :
iYi=11Xiβ>0=1iYi=01Xiβ>0=1β
maxβ∑i=1NYi⋅1Xiβ>0−∑i=1N(1−Yi)⋅1Xiβ>0
이것은 이산 반응 모델을 추정하는 데 특히 친숙한 객관 함수가 아니지만 객관 함수에 대해 약간의 대수를 수행하는 동안 나에게 견딜 수 있습니다.
===∑i=1NYi⋅1Xiβ>0−∑i=1N(1−Yi)⋅1Xiβ>0∑i=1NYi⋅1Xiβ>0−∑i=1N1Xiβ>0+∑i=1NYi⋅1Xiβ>0∑i=1NYi⋅1Xiβ>0−∑i=1N1Xiβ>0+∑i=1NYi⋅1Xiβ>0+∑i=1N1−∑i=1N1+∑i=1NYi−∑i=1NYi∑i=1NYi⋅1Xiβ>0+∑i=1N(1−Yi)(1−1Xiβ>0)−∑i=1N1+∑i=1NYi
이제 해당 합계의 마지막 두 용어는 함수가 아니므로 최대화에서 무시할 수 있습니다. 마지막으로, 우리는 당신이 해결하고자하는 문제, "참 긍정과 거짓 긍정의 차이를 최대화하는 것"이이 문제와 동일 :
β
maxβ∑i=1NYi⋅1Xiβ>0+∑i=1N(1−Yi)(1−1Xiβ>0)
이제 견적자는 이름이 있습니다! 최대 점수 추정기로 명명됩니다. 이산 반응 모델의 모수를 추정하는 매우 직관적 인 방법입니다. 파라미터는 정확한 예측의 수를 최대화하도록 선택된다. 첫 번째 항은 진양 수이고 두 번째 항은 진 음성의 수입니다.
이것은 (이진) 이산 반응 모델을 추정하는 아주 좋은 방법입니다. 예를 들어 추정기는 일관됩니다. (Manski, 1985, J Econometrics)이 추정기에는 약간의 이상한 점이 있습니다. 첫째, 작은 샘플에서는 고유하지 않습니다. 최대화를 해결하는 하나의 를 찾으면 데이터 세트에서 정확히 동일한 예측을 만드는 다른 는 최대화를 해결합니다. 따라서 발견 한 것과 거의 비슷한 많은 있습니다. 또한 추정량은 무증상으로 정상적이지 않으며 일반적인 최대 우도 추정량보다 느리게 수렴합니다.-루트 대신에 루트βββNN수렴. (Kim and Pollard, 1990, Ann of Stat) 마지막으로 부트 스트래핑을 사용하여 추론 할 수 없습니다. (Abrevaya & Huang, 2005, Econometrica)이 평가자를 사용하는 논문이 있지만, Caudill, International Journal of Forecasting, 2003 년 4 월, v. 19, is의 NCAA 농구 토너먼트에서 결과를 예측하는 것에 관한 재미있는 논문이 있습니다. 2, 313-17 쪽.
이러한 문제를 대부분 극복하는 추정기는 Horowitz의 평활 최대 점수 추정기입니다 (Horowitz, 1992, Econometrica and Horowitz, 2002, J of Econometrics). 이것은 부트 스트랩을 할 수 있는 루트 일관되고, 무증상적인, 고유 한 추정기를 제공합니다. Horowitz는 웹 페이지 에서 견적 도구를 구현하는 예제 코드를 제공합니다 .N