보험 위험 예측 모델을 개발 중입니다. 이 모델은 항공사 노쇼 예측, 하드웨어 오류 감지 등과 같은 "희귀 이벤트"입니다. 데이터 세트를 준비 할 때 분류를 적용하려고했지만 부정적인 사례가 많기 때문에 유용한 분류기를 얻을 수 없었습니다. .
고등학교 통계 과정 이외의 통계 및 모델링 데이터에 대한 경험이 많지 않아 다소 혼란 스럽습니다.
처음 생각할 때, 불균일 한 포아송 프로세스 모델을 사용하려고 생각했습니다. 특정 날짜의 특정 장소에서 특정 시간에 위험이 발생할 가능성을 잘 평가하기 위해 이벤트 데이터 (날짜, 위도, 경도)를 기준으로 분류했습니다.
희귀 한 사건을 예측하는 방법론 / 알고리즘이 무엇인지 알고 싶습니다.
이 문제를 해결하기 위해 어떤 방법을 권장합니까?