비닝을 항상 피해야하는 이유에 대한 몇 가지 게시물을 읽었습니다 . 이 링크에 대한 해당 주장에 대한 대중적인 참조 .
비닝 포인트 (또는 컷 포인트)는 결과적으로 손실되는 정보뿐만 아니라 임의적이며 스플라인이 선호되어야합니다.
그러나 현재 Spotify API를 사용하고 있습니다. Spotify API는 여러 기능에 대한 지속적인 자신감 측정 방법이 있습니다.
하나의 기능 "instrumentalness"를 보면 참조 상태는 다음과 같습니다.
트랙에 보컬이 없는지 여부를 예측합니다. "Ooh"및 "aah"사운드는이 맥락에서 중요한 역할을합니다. 랩 또는 음성 단어 트랙은 분명히 "음성"입니다. 악기 값이 1.0에 가까울수록 트랙에 보컬 컨텐츠가 포함되지 않을 가능성이 높습니다. 0.5보다 큰 값은 도구 트랙을 나타 내기위한 것이지만 값이 1.0에 가까울수록 신뢰도가 높습니다.
데이터의 매우 왼쪽으로 치우친 분포 (샘플의 약 90 %가 거의 0보다 크지 않음)를 감안할 때이 기능을 "instrumental"(값이 0.5보다 큰 모든 샘플)과 "non_instrumental"의 두 가지 범주 형 기능으로 변환하는 것이 합리적이라는 것을 알았습니다. "(값이 0.5 미만인 모든 샘플).
이것이 잘못 되었습니까? 그리고 거의 모든 나의 (지속적인) 데이터가 단일 값을 중심으로 회전 할 때 대안이 무엇 이었을까요? 스플라인에 대해 이해 한 결과 분류 문제 (내가하는 일)와 함께 작동하지 않습니다.