문제
범죄 데이터의 레이블이 지정된 데이터 세트에서 Naive 베이를 사용하려고 시도했지만 실제로는 좋지 않은 결과를 얻었습니다 (7 % 정확도). Naive Bayes는 내가 사용했던 다른 알고리즘보다 훨씬 빠르게 실행되므로 점수가 왜 그렇게 낮은 지 알아 내고 싶었습니다.
연구
읽은 후 Naive bayes는 균형 잡힌 데이터 세트와 함께 사용해야한다는 것을 알았습니다. 주파수가 높은 클래스에 대한 편향이 있기 때문입니다. 내 데이터의 균형이 맞지 않기 때문에 데이터 왜곡을 처리하기 위해 특별히 만들어 졌기 때문에 보완 Naive Bayes를 사용 해보고 싶었습니다. 프로세스를 설명하는 논문에서 응용 프로그램은 텍스트 분류를위한 것이지만 다른 상황에서는이 기술이 작동하지 않는 이유를 알 수 없습니다. 내가 참조하는 논문을 여기에서 찾을 수 있습니다 . 요컨대 아이디어는 클래스가 표시되지 않는 발생을 기반으로 가중치를 사용하는 것입니다.
약간의 연구를 한 후에 Java로 구현을 찾을 수 있었지만 불행히도 Java를 알지 못하며 알고리즘을 잘 이해하지 못합니다.
질문
파이썬에서 구현을 찾을 수있는 곳은 어디입니까? 그것이 존재하지 않는다면 어떻게 구현해야합니까?