누군가가 Kurtosis에 대한 정보로 나를 도울 수 있는지 궁금합니다 (즉, 데이터를 줄이기 위해 데이터를 변환하는 방법이 있습니까?)
많은 수의 사례와 변수가있는 설문지 데이터 세트가 있습니다. 내 변수 중 일부에 대해 데이터는 많은 참가자가 변수에 대해 정확히 동일한 점수를 주었다는 사실에서 파생 된 상당히 높은 첨도 값 (즉, 렙 토쿠 르틱 분포)을 보여줍니다. 특히 표본 크기가 크므로 중앙 한계 정리에 따르면 정규성 위반은 여전히 괜찮습니다.
그러나 문제는 특히 높은 수준의 Kurtosis가 내 데이터 세트에서 많은 일 변량 이상 치를 생성한다는 사실입니다. 따라서 데이터를 변환하거나 특이 치를 제거 / 조정하더라도 높은 수준의 첨도는 가장 높은 다음 점수가 자동으로 특이 치가됨을 의미합니다. (Discriminant function analysis)를 사용하는 것을 목표로합니다. DFA는 위반이 특이 치가 아닌 왜곡으로 인해 발생하는 경우 정상에서 벗어나는 데 강력하다고합니다. 또한 DFA는 특히 데이터의 특이 치 (Tabachnick & Fidel)의 영향을받는 것으로 알려져 있습니다.
이 문제를 해결하는 방법에 대한 아이디어가 있습니까? (내 초기 생각은 Kurtosis를 제어하는 방법 이었지만 대부분의 샘플이 비슷한 등급을 주면 좋지 않은가요?)