데이터 분류 는 데이터 세트의 극단 값을 각 끝에서 특정 백분위 수 값 으로 바꾸는 것을 의미하며 , 트리밍 또는 자르기는 이러한 극단 값을 제거 합니다.
난 항상 같은 평균이나 표준 편차와 같은 통계를 계산할 때 이상치의 영향을 줄일 수있는 실행 가능한 옵션으로 설명한 두 가지 방법을 모두 볼 수 있지만, 내가 보지 못한 이유 하나가 다른 통해 하나를 선택할 수 있습니다.
Winsorizing 또는 Trimming을 사용할 때의 장점이나 단점이 있습니까? 한 가지 방법이 바람직한 특정 상황이 있습니까? 실제로 더 자주 사용됩니까, 아니면 기본적으로 상호 교환이 가능합니까?