논문을 검토하면서 저자들은 "정규의 전제 조건 가정을 만족시키기 위해 t 개의 검정을 수행하기 전에 자연 로그를 사용하여 기울어 진 분포를 나타내는 연속적인 결과 변수를 변환했습니다"라고 말합니다.
비정규 데이터를 분석 할 수있는 적절한 방법입니까, 특히 기본 분포가 반드시 로그 정규성이 아닌 경우
이것은 매우 어리석은 질문 일지 모르지만 이전에는이 일을 보지 못했습니다 ....
논문을 검토하면서 저자들은 "정규의 전제 조건 가정을 만족시키기 위해 t 개의 검정을 수행하기 전에 자연 로그를 사용하여 기울어 진 분포를 나타내는 연속적인 결과 변수를 변환했습니다"라고 말합니다.
비정규 데이터를 분석 할 수있는 적절한 방법입니까, 특히 기본 분포가 반드시 로그 정규성이 아닌 경우
이것은 매우 어리석은 질문 일지 모르지만 이전에는이 일을 보지 못했습니다 ....
답변:
일반적이지 않은 데이터가있을 때 어떤 종류의 변환을 정규성 (예 : 로그, 제곱근 등)에 적용하려고 시도하는 것이 일반적입니다. 대수는 왜곡 된 데이터에 대해 합리적으로 자주 좋은 결과를 낼 수 있지만이 특정 경우에는 제대로 작동 할 것이라는 보장은 없습니다. 또한 변환 된 데이터를 분석 할 때 @whubers는 위의 의견을 염두에 두어야합니다. "로그에 대한 t- 검정은 변환되지 않은 데이터에 대한 t- 검정과 비모수 검정과 동일하지 않습니다. 로그에 대한 t- 검정은 기하 비교 "(일반적인) 산술 수단이 아니라"
변환 된 데이터가 "정상적으로"보이는지 여부를 평가하려면 정규성으로 변환 한 후에는 항상 정규성 가정을 조사해야합니다. 예를 들어 히스토그램, QQ- 플롯 및 정규성 테스트를 사용하여 수행 할 수 있습니다. t- 검정은 왜도 형태의 정규성 편차에 민감하므로 비대칭 대안에 대한 정규성 검사가 바람직합니다. 피어슨의 샘플 왜도 는이 경우 적합한 검정 통계량입니다.
대부분의 경우 작동하므로 변환 (예 : 로그)을 선택하는 대신 지정된 데이터를 사용하여 변환을 선택하기 위해 Box-Cox 프로 시저 를 사용하는 것이 좋습니다 . 그러나 이것에는 몇 가지 철학적 인 문제가 있습니다. 특히 어떤 변환을 사용할지 선택할 때 샘플의 일부 정보를 사용했기 때문에 이것이 t- 검정의 자유도에 영향을 미치는지 여부입니다.
마지막으로 변환 후 t- 검정을 사용하거나 기존의 비모수 적 테스트를 사용 하는 대신 t- 검정 의 부트 스트랩 아날로그 를 사용하는 것이 좋습니다 . 그것은 정규성의 가정을 요구하지 않으며 변형되지 않은 수단에 대한 시험 (그리고 다른 것에 대한 시험은 아님)입니다.