몇 가지 로지스틱 회귀 문제를보고 있습니다. ( "일반"및 "조건부").
이상적으로는 glm이 낮은 가중치의 사례를 잘못 분류 할 가능성이 있지만 높은 가중치의 사례를 정확하게 예측하는 데 더 집중할 수 있도록 각 입력 사례에 가중치를 부여하고 싶습니다.
분명히 이것은 전에 이루어졌습니다. 누구나 나를 관련 문헌으로 안내 할 수 있습니까 (또는 수정 된 가능성 함수를 제안 할 수도 있습니다).
감사!
1
예측과 달리 분류가 목표라고 가정합니다. 확률을 최적으로 추정하기 위해 아무것도 다시 가중치를 지정할 필요가 없습니다. "거짓 부정"및 "거짓 긍정적"은 강제 선택에서만 발생하며 일반적으로 순수한 이진 선택을 강요하는 사람은 없습니다.
—
Frank Harrell
@ 프랭크 당신은 좋은 지적을합니다. 궁극적으로이 프로젝트의 목표는 추가 이벤트의 결과를 예측하는 것입니다. (따라서 훈련 데이터가있는 머신 러닝 기술로 생각할 수 있습니다.) 일부 결과는 다른 결과보다 "중요"하므로 그에 따라 가중치를 적용 할 방법을 찾고있었습니다. 우도 함수에 대한 Nick의 제안은 의미가 있으며 코드로 구현하기에는 매우 간단해야합니다.
—
노아
가중치가 필요없는 정확한 확률 모델이 필요한 것처럼 들립니다.
—
Frank Harrell
권리; 비용 함수를 연결하고 예측 된 확률을 사용하면 최적의 결정을 내릴 수 있습니다.
—
Frank Harrell
잘 보정 된 확률 모델에는 "오류"가 없으며 예측할 수없는 임의성이 있습니다. 최적의 결정은 예측 된 확률의 함수이며 다양한 결정을 내릴 수있는 비용 함수입니다.
—
Frank Harrell